结果的不确定性是体育比赛的魅力所在
本文选自《中国统计》2022年第2期文章,原文已获出版社和作者授权。
北京2022冬季奥运会无疑是人类历史上一次十分成功的体育盛会,它冲破了冬天的寒冰,给全人类带来了春天的气息。世界各国的人们团结在一起,暂时忘却了大疫的苦痛和战争的威胁,尽情展现人类追求更快、更高、更强的目标,体育比赛显示出了它独特的魅力。本文试图从体育比赛出发谈谈不确定性的作用。
体育比赛的目标
体育比赛的最初目的,应该就是要让实力强大的选手脱颖而出,最好能够按照选手的真正实力给出准确的排名。但现代体育比赛还有更崇高的目的,促进和加强各国运动员之间的友谊,让世界各国人民增进相互了解、加强团结合作。为了达到这个崇高目标,必须使得体育比赛具有较大吸引力,吸引更多的人参与和关注比赛。
这两个目的缺一不可,都是现代体育比赛项目设计中要考虑到的。所以,比赛规则的设计一方面是为了让有实力的运动员尽可能脱颖而出,另一方面还需要使得比赛具有极大的吸引力。这是具有矛盾的两个方面,需要进行一定的利弊取舍和权衡。
比赛规则的设置
在冬奥会决赛阶段,有冰壶两两捉对厮杀的循环制,有速度滑冰、短道速滑等速度类项目的一局决胜制,有自由式滑雪大跳台、滑雪单板大跳台等比赛的三轮比赛中两次最高值相加,有自由式滑雪坡面障碍大跳台、空中技巧和单板滑雪的三轮比赛中的最高值,有男子单人、女子单人无舵雪橇比赛的4轮滑行累计的时间决定名次制,有钢架雪车、男女双人雪橇等两轮成绩相加决定名次制等等。
从这些竞赛规则可以了解到,一种比赛项目,如果如果受外界影响很小,则可采取一局决胜制;如果受外界影响很大,则需要进行多轮比赛,以最好成绩或者多轮成绩累加来决定名次。这样做的目的是保证有实力者以相对较大概率胜出。但这个目的又不能执行得过分,否则就不具有可观赏性了。我们设想,如果增加比赛轮次到足够多,而采取胜多轮者胜出,则实力强者一定能够取胜,则这时不确定性降低。所以体育比赛要设计好,一方面是为了让有实力的运动员能够以相对较大可能性脱颖而出,另一方面还需要使得比赛结果具有足够大的不确定性。乒乓球比赛从21分为一局改为11分为一局,就是为了增加不确定性。这两个目的是有些矛盾的,让有实力选手胜出的概率增大,则会降低不确定性,必须在设计竞赛规则时加以权衡。体育比赛的魅力除了速度、高度、强度的极限外,很重要的一点就是比赛结果的不确定性。
不确定性是什么
前面谈到的不确定性表示一个比赛结果不可确定的程度。不确定性一般来说可以用熵来度量。涉及到体育比赛中的不确定性,我们可以想到的是,既有认知的不确定性,也有概率的不确定性。
对于选手的认识程度,我们可以通过一个0与1之间的分布来描述。如果我们对选手实力完全不了解,则比赛结果对于我们来说就具有最大的不确定性,比如我们经常说比赛胜出的黑马,就是由于我们不了解情况所导致的结果。这相当于认为对选手的胜率完全没有概念,可以认为胜率服从0与1之间的均匀分布,此时不确定性达到最大。如果我们对选手有所了解,但又不是十分了解,则对胜率可以通过一个贝塔分布来描述,其中分布的参数可以表示对选手了解的程度。而认知不确定性就可以通过这个分布计算出来。此时认知不确定性就介于最大最小之间。每次比赛新手的加入,黑马的出现,也是体育比赛的魅力所在,它的本质是增加了比赛结果的不确定性。
如果我们对选手的实力有了充分了解,但由于各种各样的影响,比赛结果具有随机性,仍然是不确定的,这种不确定性就是概率的不确定性。如果一项体育比赛中每个选手赢得比赛的可能性越接近相等,则这项比赛的不确定性越大,越能够吸引人来观看。冬奥会的很多项目都是充满魅力的,因为它们的不确定性实在是太大了。许多比赛最后总在几个顶级水平的运动员中竞争,他们实力相当,每个人赢得比赛的可能性都是差不多的,谁都有可能赢得比赛,此时不确定性接近最大,可观赏性也接近最大。而前些年世界级的乒乓球大赛中,由于中国选手实力太强,使得比赛毫无悬念,这种比赛的不确定性很小,从而可观赏性不大。
在实际的体育比赛当中,认知不确定性和概率不确定性一般都同时存在的。很少的时候会有选手百分百一定能赢得比赛,更多的时候赢的可能性是大于0而小于1的,此时则概率不确定性就存在了。而几乎每次大赛都会有新手的加入,这就增加了认知的不确定性。观众观看比赛一般会比专家观看比赛的兴趣更大,因为对于一般的观众来说,他们的认知不确定性比专家要大得多。
不确定性产生魅力的原因
前面我们说不确定性是体育比赛的魅力来源之一。那么人们为什么会对不确定性大的比赛结果感兴趣?我们在此试图进行一些探讨。我们猜想,是因为人们总是在有意或无意中希望在有限的时间内获得较多的信息。而一个比赛的不确定性大,则意味着观众对这个比赛具备的认知信息量少,一旦知道了比赛的最后结果甚至比赛细节,则会有信息量的极大提高,就增加了自己的认知能力。当观众把这个比赛的最终结果和比赛细节告知没有看比赛的朋友时,则会更容易引起朋友的兴趣,从而可以提高自己在朋友圈中的地位。反之,如果是一场毫无悬念的比赛,这样的比赛不确定性是最小的,在比赛之前信息量已达到了最大值,那么在知道最后结果以后,信息量也不会提高。这个确定性的结果也就没有必要和朋友谈起了。
不确定性的度量
前面我们谈到不确定性可以通过熵来度量。熵是一个物理量,它本质上是表示一个系统混乱的程度。可以通过概率分布取对数后的相反数再求期望平均来给出定义。这个量的不足之处是它不是一个小于1的正数。在一个有限区间内,均匀分布的熵达到最大。这意味着如果没有任何倾向性,则不确定性最大。另外,有意思的是,在方差一定时,整个数轴上的分布熵最大的是正态分布。对于两点分布,当每个概率都是二分之一时熵最大。这可以解释,当两个比赛选手旗鼓相当时,不确定性最大。对于更加一般的情形,对有限个点的离散分布,当落在每个点的概率相等时,熵最大。对应着多个选手竞赛时,当所有选手势均力敌的时候,不确定性最大。在物理系统中,在没有干涉情况下,很多物理系统都会倾向于熵最大,此时系统会最稳定,比如将一滴墨水滴到一碗清水中,则在足够长时间后墨水会均匀分布到碗中,此时熵达到最大,不会再有变化。社会系统也往往有这种情形,比如在机场中,如果允许随便选择,而每个候机者都是独立的,则候机者一般会均匀落座。
对于随机变量来说,熵的概念不能完全反映随机变量的不确定性,人们还使用方差等概念。为什么信息论中的熵可以衡量不确定性,而随机变量的方差等量也可以衡量不确定性,它们有什么本质差别。实际上,由于信息论中人们传递的基本符号都是固定的,比如0和1,或者26个英文字母加数字0-9,而不同的只是它们相应的概率值,所以用熵就能够很好地表达了信息传递的不确定性。但随机变量的不确定性却不能完全由概率值决定,还和它们的取值范围有关。也就是说在比较随机变量之间的不确定时,我们还要考虑它们取值范围大小带来的不确定性。
总结
人们通常认为不确定性总是不好的,希望追求能够完全确定的事情,而实际中不确定性有时可以带来好处。我们从体育比赛谈到了不确定性的重要性。体育比赛的竞赛规则一方面要有较大可能性保证强者胜出,另一方面也要保证一定的不确定性,从而可以使得比赛具有可观赏性。实际中要对这两个矛盾点要进行权衡。乒乓球比赛从21分为一局改为11分为一局就是一个增加不确定性的很好例子。如果我们改为7分一局发生什么?此时不确定性更大了,但强者取胜的概率也变小了。
作者简介
房祥忠教授 在北京大学数学科学学院曾任概率统计系主任,中国现场统计研究会理事长,IMS-China主席。现兼任教育部统计学类教学指导委员会主任委员,中国统计学会副会长,全国应用统计专业学位研究生教育指导委员会委员,北京企业评价协会理事长等职。研究兴趣包括:生存分析,可靠性,纵向数据,基尼系数,时空统计,人工智能中的统计方法等。在《中国科学》《JRSP》《Reliability on IEEE》等期刊发表论文50余篇。曾获国防科技奖二等奖(2011)、北京市科技进步二等奖(2002)和教育部第六届高等教育国家级教学成果二等奖(2012)。
敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。
编辑|赵霖琳
微信扫码关注该文公众号作者