台湾大选蓝白合与统计误差
今天看新闻,发现国民党和民众党为总统大选候选人的民意调查里面的“误差”争论不休。以前民众党主席柯文哲觉得自己领先一点,同意如果再误差范围内就算自己输。不过认为误差就是3%。这个3% 大家也是有公认的,因为1000多人的样本量,95% 的置信区间,基本上就是3%的样子了。但是今天底牌一番,国民党认为误差是“正负3%”,于是正的减负的变成大约6%。其中国民党主席朱立伦自认是“统计学教授”,要给柯文哲上课。什么相信科学云云。
唉,怎么说呢,这些国民党的政客,太脸皮厚了,还把“统计学”搬出来。所谓正负3%的误差,是在“两个样本无差距”这个零假设(Null Hypothesis)的分布下计算的啊。这个计算的依据是正态分布,以0为中心的。所以说,误差范围,是指的柯候配赢候柯配3% 还是 -3%的误差。也就是说,如果我们认为其实柯文哲比侯友宜就是高一点点,那么负的那边的置信区间意义不大,主要看正的一面是3%就好了。负的一面,只有侯友宜比柯文哲高的时候才有意义啊。所以在正的一方,只要是大于3%,就在误差范围以外,这有什么好说的?!
当然啦,如果非要按国民党的逻辑,柯文哲应该实实在在的比侯友宜多3%,在这个基础上再算置信区间,那还有点道理。但是,正态分布是钟形曲线,不是平的,你把分布的中心从0 移到了3%,就不一样了。所有的数据都要重新计算。但是这跟他们说的“误差”造成柯文哲领先是两回事了,成了领先3%这件事情(作为零假设)的误差。台湾那些学统计的牛人都哪里去了?这么简单的问题没人出来说话?感觉有点像当年COVID起源一样,政治问题,学术大拿都爱惜羽毛不吱声,让混子上电视,霸占舞台讲“学术”。
我其实不喜欢柯文哲(容以后再专门撰文详述),但是这一次蓝白合,柯文哲确实是相忍为国,忍辱负重,也做好了当副手的准备。但是一看数据,自己并没有输,所以忍不住再喊冤一把,吵一下。国民党还要欺人太甚(用闽南语叫“吃人够够”),上演这一出丢人现眼的丑剧,真的是他们选举语言常说的“输到脱裤”。
预测一下:柯文哲最后估计还是会妥协,多要两个部长做“拆迁费”。但是人民观感如是,蓝白合了就真的选的上吗?说实话,老共的武统派看来,你们这些人都一样,选了赖清德还简单点。