渣男受女生欢迎?当心统计陷阱
张忠元演讲视频:
以下为张忠元演讲实录:
说起“统计学”,你可能会想到CPI或GDP这些数字。这是政府统计的内容,属于统计学的一个重要分支。
其实,统计学对我们日常生活的影响远比这些数字更深入和广泛。
比如我们大家吃的药物,看起来是制药业的工作,其实统计学在其中贡献很大。如果没有统计方法,我们就没办法知道这个药它是不是一种安慰剂。什么是安慰剂?一个淀粉片,医生说是止痛的,结果吃了淀粉片的病人会有1/4报告说不疼了或症状减轻了,其实他吃的只是淀粉片——安慰剂效应的威力可见一斑。如果我们不用统计方法把安慰剂效应去掉,市场上卖的药就不一定真的是可以治病的。
其实,你在日常生活中做的重大决策,很多也是观察了身边很多事情、咨询了身边很多人而做出的。这种“收集资料——去伪存真——最终得出结论”的过程就可以叫做“统计”。
演讲嘉宾张忠元:《渣男受女生欢迎?当心统计陷阱》
统计方法和我们日常生活的联系非常紧密,但它不是靠直觉就能用好的。统计学很容易被误用和滥用。
比如,我们经常会把日常生活中相互关联的两件事情看作是有因果关系的,但其实,事实往往不是这样,这个错误在统计学上叫“相关不等于因果”。
简单来说,看到公鸡打鸣,然后太阳升起来了,但我们不能说太阳是被公鸡叫起来的。
再比如说,大数据分析表明:冰激凌销量高的时候,泳池溺水事故的发生量也会增加,所以“泳池溺水的事故的发生量”和“冰激凌的销量”这两件事是相关的——它们有共同的原因,就是季节——但它们显然没有因果关系。这是比较简单的情况。
当我们遇到更复杂局面的时候,就往往容易犯错误。比如说,看到小孩子天天玩游戏,然后他的考试成绩又比较差,家长就会很自然地把这两件事联系起来,然后简单地把“玩游戏”当做他考试成绩差的原因——其实这两件事是不是也只是具有相关关系而没有因果关系呢?它们是不是有一些共同的原因呢?家长们把这件事想清楚了,就可以给孩子提供更好的教育。
还有更隐蔽的情况。比如这是我在朋友圈看到的图。说,我和大雄差不多都没用,为什么我就没有那只叮当猫呢?其实,在大雄身上,“没有用”和“有叮当猫”这事是相关的,但是你不能把它们当作因果,所以,你没有用,也不一定有那只叮当猫。(我的朋友圈就是这么用来抬杠的,大家可以想见,我能有多少朋友…… )
再比如这个:
她是怎么痊愈的?大家自己心里想。
还有更好笑的例子。
这个发言人犯的错误就是,认为特定的影片类型和特定的消费行为是相关的——但这其实是虚假相关,就是说,“相关性”本身并不存在,它就是个巧合。为什么这么说呢?因为《芳华》是在冬天上映的。
另外,我要强调一句:相关固然不等于因果,但是相关里边也许蕴含着因果,所以往往需要科学家做更多的工作来研究。当然,这是后话。
“我是科学家”开设了一个栏目,叫做“我问科学家”。在电影里扮演了渣男的明星佟大为先生问了这么一个问题:为什么渣男还会被喜欢?
要我说,这是个伪问题。这是没问我,问我的话,这节目办一期就结束了。
(这么用朋友圈,可以想见,我真的没多少朋友了……)
为什么说它是个伪问题呢?容我慢慢道来。
在我看来,要厘清这个问题,至少要分为三个层面。
第一个层面,什么是“渣”?我理解的意思是“花心”。
第二个层面,女生知道他渣吗?如果女生不知道他渣,这叫诈骗,不在我们的讨论范围之内。
第三个层面,女生知道他渣,而且在同等条件之下比他不渣更喜欢,也就是说这个男生如果不渣了,不花心了,这个女生就没那么喜欢他了——这事儿存在不存在?我心里是打了一个大大的问号的。
演讲嘉宾张忠元:《渣男受女生欢迎?当心统计陷阱》
人们为什么会产生这种认知?在统计学上也早有研究,至少涉及到两个知识点,一个是生存偏差,一个是隐含变量。
生存偏差的意思是,大家只会关注到或更多地关注到那些活下来的、成功的案例,而会忽略掉那些失败的、没有活下来的案例,进而分析那些活下来的成功的案例有什么经验、有什么特点,这其实没啥价值。
具体到这个问题,你只关注到或者看到了那些有人爱的渣男,而忽略掉了那些大量的没人爱的渣男,进而分析这些有人爱的渣男有什么特点,这事有价值吗?成功学走的都是这个套路,只分析那些成功的案例有什么特点,但你要是当真就废了。
比如这个,每年都有一次:高考状元有个特点,你家孩子有没有?有什么特点呢?难道是“都说中文”吗?我心里好高兴,我家孩子也有。
第二个问题是隐含变量。固然,有的渣男活下来了,有人爱了,但是这个“渣”的属性是给他减分的,让他有人爱的原因可能是他的其他属性。所以,这里如果忽略那些其他属性,简单地来分析“渣男有人爱”这事儿就不靠谱。
当然我们承认,在不同的女生眼里,这些属性的重要性排序不一样。比如,有人是颜控,看重颜值,只要有颜,其他都不重要;有大叔控,只要成熟,其他的都不重要;还有的看重男生经济状况,但我确实没听说有渣控的。
说到隐含变量,再来看下面这个研究。
发表在美国一个期刊上的这么一个论文,说“清洁产品对女性肺部的伤害相当于每天都吸一包烟,而对男性的肺部无影响”。看到这,我差点没哭了,这是什么有毒的研究,为了让男生干家务都这么拼了嘛?“对女生的影响这么大,而对男生的肺部没有影响”这事儿不是很诡异吗?只要是谈到“男生做家务”这样的研究,我都会认真对待,一定要写文章来反驳的。(毕竟书不能白读。多读点书,就能在家庭当中立于不败之地。所以我离婚之后□□□□)
好,咱们言归正传。
这个研究,要我看就是忽略了一个隐含变量:做饭。爱清洁的女性往往更愿意做饭,而做饭是伤肺的,而对男性而言,清洁更可能是他的一个职业,和他做饭不做饭没啥关系。
再来看这个。如果我们考虑不同医院肿瘤科的死亡率,你会发现著名医院肿瘤科的死亡率可能比下级医院的更高。那是不是说,著名医院的医生的水平也没有很高?这当然不是事实。因为这里也是忽略了一个隐含变量:肿瘤类型。到顶级医院看病的大部分都是难治性的肿瘤,死亡率本身就高。但是这个情况比较明显。
下面这个例子就没有那么明显了,需要大家一点思索。
人们发现,美国伯克利大学在招生录取当中,女生的录取率明显偏低,于是质疑伯克利大学存在“性别歧视“的问题——这事儿看起来没毛病,数据就摆在这里,还有什么话讲?但那是你的反应。人家伯克利大学那是一根头发分8瓣,细得很,不会轻易就说存在这个问题。当然,事实也的确不是这样。
因为,如果分专业来看,你就会发现:在各个专业女生的录取率其实都是更高的。之所以会产生“总体录取率女生偏低”这一结果,是因为女生大部分都报考了那些本身就难以录取的学院,而男生则大部分报考了那些录取率本身就偏高的学院。这个现象就叫“辛普森悖论”。
再来看下面这个例子。
这是2组人,每组10个人。大家进行过关游戏,过关人数多的那组获胜。
关卡有两种,一种是简单模式,一种是困难模式。不管你选择哪种关卡,只要过关就算获胜。
那么因为各种原因,第一组人更愿意选择简单模式。大家看一共10个人,有8个人选择了简单模式。第二组人更愿意选择困难模式,一共10个人,有8个人选择了困难模式。
经过比赛结果如下:在简单模式下,第一组人有7个人过关,获胜了;第二组人全部过关。所以在简单模式下,第二组人他的过关率是更高的。类似的分析,在困难模式下,第二组人他的过关率也是更高的。可是总体来看,第一组的过关率就更高了。这个现象就是“辛普森悖论”,因为第一组人更多的选择简单模式了,简单模式本身过关率就更高。回到刚才“肿瘤医院和死亡率”的例子。那些著名肿瘤医院里的医生就好像那些更愿意选择困难模式的选手一样,本身就是命苦。
刚才讲了这么多统计学的误用,其实我们还要注意:统计学不能滥用。
如果我们在社会治理当中滥用统计,后果就很严重了。比如,我们住在北京,如果统计来自各个省的人的犯罪率,假如,我是说假如统计得出结论,东北人的犯罪率更高,那我们能不能要求东北人晚上不许出门呢?显然不能这么做。
为什么不能这样做?因为我们把一个基于群体的总体结论用在了个体身上,何况这种结论可能还有其他隐含因素。而每个人都是很宝贵的,这种决策即便是伤害到了一个个体,代价也是巨大的、不可弥补的。我们在做决策时,都是在损失和收益之间做平衡的,而这种决策损失巨大,违背了伦理,属于统计学的滥用。它有一个专业的名词叫“统计性歧视”,这种决策不会发生。但是在日常生活当中,统计性歧视却常常在发生。那些戴着有色眼镜,按照性别、按照种族、按照籍贯来区别对待别人的行为,又岂止是一件两件?
不过,话说回来,你可以想象一个场景:一个女孩晚上夜归,后边有个男生一直跟着你——这个时候你该跑还得跑,不能说“张老师说了,我要是跑了,就是把他当坏人,这属于统计性歧视,我得跟他先交换个微信聊一聊,看他是不是坏人”。这样就属于僵化了,有枣没枣打三杆子,这不行。
记住:统计学你要慎用,不能滥用。
最后,作为统计学者,我要做一个统计:请没有来的朋友举手。没人举手,看来全北京的科普爱好者都来了,我这是要火。感谢各位的耐心。
演讲嘉宾张忠元:《渣男受女生欢迎?当心统计陷阱》
作者:张忠元
编辑:麦芽杨
本文版权属于“我是科学家”,未经授权不得转载。
如需转载请联系[email protected]
微信扫码关注该文公众号作者