Redian新闻
>
渣男受女生欢迎?当心统计陷阱

渣男受女生欢迎?当心统计陷阱

公众号新闻
编者按:
科学的力量很强大,然而科学的道理并不遥远,它就蕴含在市井之间。听中央财经大学统计与数学学院教授张忠元来聊聊生活中常见的统计陷阱。



张忠元演讲视频:


以下为张忠元演讲实录:


说起“统计学”,你可能会想到CPI或GDP这些数字。这是政府统计的内容,属于统计学的一个重要分支。


其实,统计学对我们日常生活的影响远比这些数字更深入和广泛。


比如我们大家吃的药物,看起来是制药业的工作,其实统计学在其中贡献很大。如果没有统计方法,我们就没办法知道这个药它是不是一种安慰剂。什么是安慰剂?一个淀粉片,医生说是止痛的,结果吃了淀粉片的病人会有1/4报告说不疼了或症状减轻了,其实他吃的只是淀粉片——安慰剂效应的威力可见一斑。如果我们不用统计方法把安慰剂效应去掉,市场上卖的药就不一定真的是可以治病的。


其实,你在日常生活中做的重大决策,很多也是观察了身边很多事情、咨询了身边很多人而做出的。这种“收集资料——去伪存真——最终得出结论”的过程就可以叫做“统计”。


演讲嘉宾张忠元:《渣男受女生欢迎?当心统计陷阱》


统计方法和我们日常生活的联系非常紧密,但它不是靠直觉就能用好的。统计学很容易被误用和滥用。



比如,我们经常会把日常生活中相互关联的两件事情看作是有因果关系的,但其实,事实往往不是这样,这个错误在统计学上叫“相关不等于因果”。


简单来说,看到公鸡打鸣,然后太阳升起来了,但我们不能说太阳是被公鸡叫起来的。


再比如说,大数据分析表明:冰激凌销量高的时候,泳池溺水事故的发生量也会增加,所以“泳池溺水的事故的发生量”和“冰激凌的销量”这两件事是相关的——它们有共同的原因,就是季节——但它们显然没有因果关系。这是比较简单的情况。


当我们遇到更复杂局面的时候,就往往容易犯错误。比如说,看到小孩子天天玩游戏,然后他的考试成绩又比较差,家长就会很自然地把这两件事联系起来,然后简单地把“玩游戏”当做他考试成绩差的原因——其实这两件事是不是也只是具有相关关系而没有因果关系呢?它们是不是有一些共同的原因呢?家长们把这件事想清楚了,就可以给孩子提供更好的教育。



还有更隐蔽的情况。比如这是我在朋友圈看到的图。说,我和大雄差不多都没用,为什么我就没有那只叮当猫呢?其实,在大雄身上,“没有用”和“有叮当猫”这事是相关的,但是你不能把它们当作因果,所以,你没有用,也不一定有那只叮当猫。(我的朋友圈就是这么用来抬杠的,大家可以想见,我能有多少朋友…… )


再比如这个:


她是怎么痊愈的?大家自己心里想。


还有更好笑的例子。


这个发言人犯的错误就是,认为特定的影片类型和特定的消费行为是相关的——但这其实是虚假相关,就是说,“相关性”本身并不存在,它就是个巧合。为什么这么说呢?因为《芳华》是在冬天上映的。


另外,我要强调一句:相关固然不等于因果,但是相关里边也许蕴含着因果,所以往往需要科学家做更多的工作来研究。当然,这是后话。



“我是科学家”开设了一个栏目,叫做“我问科学家”。在电影里扮演了渣男的明星佟大为先生问了这么一个问题:为什么渣男还会被喜欢?


要我说,这是个伪问题。这是没问我,问我的话,这节目办一期就结束了。

(这么用朋友圈,可以想见,我真的没多少朋友了……)


为什么说它是个伪问题呢?容我慢慢道来。


在我看来,要厘清这个问题,至少要分为三个层面。


第一个层面,什么是“渣”?我理解的意思是“花心”。


第二个层面,女生知道他渣吗?如果女生不知道他渣,这叫诈骗,不在我们的讨论范围之内。


第三个层面,女生知道他渣,而且在同等条件之下比他不渣更喜欢,也就是说这个男生如果不渣了,不花心了,这个女生就没那么喜欢他了——这事儿存在不存在?我心里是打了一个大大的问号的。


演讲嘉宾张忠元:《渣男受女生欢迎?当心统计陷阱》


人们为什么会产生这种认知?在统计学上也早有研究,至少涉及到两个知识点,一个是生存偏差,一个是隐含变量


生存偏差的意思是,大家只会关注到或更多地关注到那些活下来的、成功的案例,而会忽略掉那些失败的、没有活下来的案例,进而分析那些活下来的成功的案例有什么经验、有什么特点,这其实没啥价值。


具体到这个问题,你只关注到或者看到了那些有人爱的渣男,而忽略掉了那些大量的没人爱的渣男,进而分析这些有人爱的渣男有什么特点,这事有价值吗?成功学走的都是这个套路,只分析那些成功的案例有什么特点,但你要是当真就废了。


比如这个,每年都有一次:高考状元有个特点,你家孩子有没有?有什么特点呢?难道是“都说中文”吗?我心里好高兴,我家孩子也有。


第二个问题是隐含变量。固然,有的渣男活下来了,有人爱了,但是这个“渣”的属性是给他减分的,让他有人爱的原因可能是他的其他属性。所以,这里如果忽略那些其他属性,简单地来分析“渣男有人爱”这事儿就不靠谱。

当然我们承认,在不同的女生眼里,这些属性的重要性排序不一样。比如,有人是颜控,看重颜值,只要有颜,其他都不重要;有大叔控,只要成熟,其他的都不重要;还有的看重男生经济状况,但我确实没听说有渣控的。


说到隐含变量,再来看下面这个研究。


发表在美国一个期刊上的这么一个论文,说“清洁产品对女性肺部的伤害相当于每天都吸一包烟,而对男性的肺部无影响”。看到这,我差点没哭了,这是什么有毒的研究,为了让男生干家务都这么拼了嘛?“对女生的影响这么大,而对男生的肺部没有影响”这事儿不是很诡异吗?只要是谈到“男生做家务”这样的研究,我都会认真对待,一定要写文章来反驳的。(毕竟书不能白读。多读点书,就能在家庭当中立于不败之地。所以我离婚之后□□□□)


好,咱们言归正传。


这个研究,要我看就是忽略了一个隐含变量:做饭。爱清洁的女性往往更愿意做饭,而做饭是伤肺的,而对男性而言,清洁更可能是他的一个职业,和他做饭不做饭没啥关系。


再来看这个。如果我们考虑不同医院肿瘤科的死亡率,你会发现著名医院肿瘤科的死亡率可能比下级医院的更高。那是不是说,著名医院的医生的水平也没有很高?这当然不是事实。因为这里也是忽略了一个隐含变量:肿瘤类型。到顶级医院看病的大部分都是难治性的肿瘤,死亡率本身就高。但是这个情况比较明显。


下面这个例子就没有那么明显了,需要大家一点思索。

人们发现,美国伯克利大学在招生录取当中,女生的录取率明显偏低,于是质疑伯克利大学存在“性别歧视“的问题——这事儿看起来没毛病,数据就摆在这里,还有什么话讲?但那是你的反应。人家伯克利大学那是一根头发分8瓣,细得很,不会轻易就说存在这个问题。当然,事实也的确不是这样。

因为,如果分专业来看,你就会发现:在各个专业女生的录取率其实都是更高的。之所以会产生“总体录取率女生偏低”这一结果,是因为女生大部分都报考了那些本身就难以录取的学院,而男生则大部分报考了那些录取率本身就偏高的学院。这个现象就叫“辛普森悖论”


再来看下面这个例子。



这是2组人,每组10个人。大家进行过关游戏,过关人数多的那组获胜。


关卡有两种,一种是简单模式,一种是困难模式。不管你选择哪种关卡,只要过关就算获胜。


那么因为各种原因,第一组人更愿意选择简单模式。大家看一共10个人,有8个人选择了简单模式。第二组人更愿意选择困难模式,一共10个人,有8个人选择了困难模式。


经过比赛结果如下:在简单模式下,第一组人有7个人过关,获胜了;第二组人全部过关。所以在简单模式下,第二组人他的过关率是更高的。类似的分析,在困难模式下,第二组人他的过关率也是更高的。可是总体来看,第一组的过关率就更高了。这个现象就是“辛普森悖论”,因为第一组人更多的选择简单模式了,简单模式本身过关率就更高。回到刚才“肿瘤医院和死亡率”的例子。那些著名肿瘤医院里的医生就好像那些更愿意选择困难模式的选手一样,本身就是命苦。


刚才讲了这么多统计学的误用,其实我们还要注意:统计学不能滥用


如果我们在社会治理当中滥用统计,后果就很严重了。比如,我们住在北京,如果统计来自各个省的人的犯罪率,假如,我是说假如统计得出结论,东北人的犯罪率更高,那我们能不能要求东北人晚上不许出门呢?显然不能这么做。


为什么不能这样做?因为我们把一个基于群体的总体结论用在了个体身上,何况这种结论可能还有其他隐含因素。而每个人都是很宝贵的,这种决策即便是伤害到了一个个体,代价也是巨大的、不可弥补的。我们在做决策时,都是在损失和收益之间做平衡的,而这种决策损失巨大,违背了伦理,属于统计学的滥用。它有一个专业的名词叫“统计性歧视”,这种决策不会发生。但是在日常生活当中,统计性歧视却常常在发生。那些戴着有色眼镜,按照性别、按照种族、按照籍贯来区别对待别人的行为,又岂止是一件两件?


不过,话说回来,你可以想象一个场景:一个女孩晚上夜归,后边有个男生一直跟着你——这个时候你该跑还得跑,不能说“张老师说了,我要是跑了,就是把他当坏人,这属于统计性歧视,我得跟他先交换个微信聊一聊,看他是不是坏人”。这样就属于僵化了,有枣没枣打三杆子,这不行。


记住:统计学你要慎用,不能滥用。


最后,作为统计学者,我要做一个统计:请没有来的朋友举手。没人举手,看来全北京的科普爱好者都来了,我这是要火。感谢各位的耐心。


演讲嘉宾张忠元:《渣男受女生欢迎?当心统计陷阱》


作者:张忠元

编辑:麦芽杨

本文版权属于“我是科学家”,未经授权不得转载。

如需转载请联系[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
世界末日“世界上最火辣的妈妈”!美国44岁女子太漂亮,竟然比20岁女儿还受欢迎?为什么脾气越好的人,越不受欢迎?沁园春·雪年末聚餐派对,什么伴手礼最受欢迎?有了这份指南,送礼绝不出错!日餐店外爆枪案!子弹飞射击中玻璃 顾客连忙躲掩 2年轻男受伤为什么漂亮女人不再那么受欢迎?昨天爬梯,观察小孩子们挺有意思的,女孩还是文静懂事些,男孩《狂飙》大结局的隐藏真相:为什么“坏男人”更受女性欢迎?死因离奇!华人一家三口陈尸屋内,全家死亡!夫妇北大毕业,深受中国学生欢迎...关于「女攻男受」的第四爱,你需要知道这5件事必须对美国要”听其言观其行”花心滥情、未婚生子:黑料缠身的内马尔,为何这么受欢迎?中国赴美留学生首次跌破30万!最受国际生欢迎的美国大学果然是....清华经管EMBA网球协会2022年会暨新生欢迎会成功举办【Allston超高性价比公寓】超受BU学生欢迎的公寓放房啦~包水电暖杂费!接受本科生!学习和生活都超级便利~恐怖!新州女子被囚禁虐待3天3夜!或遭性虐!全身多处烧伤!另1名男受害者已暴毙!系熟人作案!五分之一美国人希望在洛杉矶居住!天使之城为什么深受移民欢迎?死因不明!华人一家三口陈尸屋内,全家离奇死亡!两夫妻北大毕业,全家开课后辅导班!深受中国学生欢迎,邻居泣不成声...消费欲望大幅降低,哪些玩具还会受欢迎?和郭采洁、英泽、丰吉一起,感受女性创作者的多元时代好样的!英勇夺枪26岁加州华男受表彰。2022最受国际生欢迎美国大学出炉!NYU蝉联榜首!华人一家三口陈尸屋内,全家离奇死亡!两夫妻北大毕业,全家开课后辅导班,深受学生欢迎!邻居泣不成声...久违了,芝加哥!为什么Python如此受欢迎?11 月谁最受欢迎?读者评选好货榜单 Top10 来了哪个星座最受欢迎?死因不明!华人一家三口陈尸屋内,全家离奇死亡!两夫妻北大毕业,全家开课后辅导班,深受学生欢迎!邻居泣不成声...《芝麻街》之父辞世!“受女儿启发”打造传奇节目,网涌哀悼!2023继续霸榜热搜!渣男受伤头破血流 她曾两次救命近期招聘怪象:为什么小厂出身的人,求职更受欢迎?揭秘丨香港高才通计划开启!什么人才最受欢迎?2022湾区房市总结| 去年一年哪里最受欢迎?哪里依然有10%+的年涨幅?为什么“歪”的比“直”的越来越受欢迎?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。