姜树生:新冠疫情中的一个影响巨大的数学欺骗
新冠疫情中的一个影响巨大的数学欺骗
1. 引子
前一段时间, 关于新冠疫情, 一个颇有争议的话题是“死亡率”: 一开始报道的“死亡率”, 各国相差很大, 于是出现了很多各种各样的解释, 这些解释不但未能释疑, 反而令人更加糊涂; 后来的情况更糟, 发现大量的漏诊, 加强了检测后, 这个“死亡率”大大降低, 在有的国家甚至降到早先报道的十分之一以下, 于是乎又出现了很多盲目乐观的论调, 说新冠肺炎并不严重, 甚至说其实还是“大号流感”, 还有人说隔离、戴口罩等都是反应过度, 甚至主张学习“群体免疫”的“成功经验”, 等等。
上面将“死亡率”都加了引号, 是为了提醒读者它很不靠谱。
但这并不是批评这个数据, 而是说, 它被滥用了。这就是标题所说的“数学欺骗”, 而且它造成了巨大的负面影响。
简言之, 这个“死亡率”是一个在研的专业数据, 对于一般人并没有用处。一般人所需要的数据, 我们在下面将详细说明。
2. 一个重要的专业数据
在医学领域, 每种疾病的死亡率, 是一个重要的专业数据, 它有助于医生的诊断, 特别是对于预后的判断。而若该种疾病是流行病, 则其死亡率有重要的流行病学意义。
这是一个医学科学课题。科学的探索一般都不是一帆风顺的, 更不是一蹴而就的。即使仅仅为了死亡率这一个数据, 也需要付出很多艰辛的劳动, 当然也就需要较长的时间才能得到较为可靠的结果。因此, 如果一开始得到的数据误差很大, 甚至超过一个数量级, 也不必大惊小怪, 更不应责骂专业研究人员。
这里所说的艰辛劳动也包括检测和统计。某国一开始检测的人数很少, 后来检测人数逐渐增多, 竟然出现确诊率越高死亡率越低的奇怪现象, 这足以说明早先的“死亡率”有多不靠谱。
于是又有人说, 早先的“死亡率”高是由于检测数量太少导致的。但这种说法也缺乏可信性, 因为没有给出被确诊者感染的时间分布, 很可能新确诊的病人大部分是新近感染的。
如果没有有效的控制, 流行病的感染人数会以近于指数的速度上升。对于新冠疫情, 这种状况已经有迹象显示。另一方面, 新冠病人即使最终死亡, 一般也会拖延较长的时间。只有用最终病死人数除以感染总人数, 才是可靠的死亡率。如果用现在已病死的人数除以现在确诊的感染人数, 所得到的“死亡率”可能低得离谱, 如果大部分的确诊者是新感染的话。
这里需要专业研究者有较好数学素质。如果检测严重不足 (例如设置了很高的检测门槛), 则根本不应该根据所得的数据计算死亡率, 因为这样得到的“死亡率”严重偏高, 毫无参考价值。而若检测充足, 则应采用正确的统计方法, 例如可以统计早期确诊的病人最终死亡的人数, 除以早期确诊人数; 若把后期感染的病人人数也加到分母里, 则所得的“死亡率”可能严重偏低, 仍是毫无参考价值。
由此可见, 研究死亡率需要有较高的专业素质, 非专业人员一般没有能力直接判断、理解和运用。遗憾的是现在有太多“无知无畏”的人, 连数据的可靠性都没有能力判断, 却敢于做非常外行的解释和演绎, 误导着他们的“粉丝”。
您如果不是专业人员, 为了避免被忽悠, 最简单的办法就是“遵医嘱”。如果您想知道一个专业数据的意义, 只能找专业人员咨询。那些外行连同他们的“粉丝”所造成的喧嚣, 无论声音多大, 您也应该充耳不闻。
就新冠而言, 目前关于死亡率, 仍在研究阶段。要过较长的一段时间, 甚至数年的时间, 才会有可以给公众使用的权威数据。您如果不是专业人员, 现在就甭操这份心了。
3. 所谓“预测”
然而在网上却看到不少大V, 从这个尚在研究的专业数据出发做了很多推导, 然后做出“预测”。其实这些大V的推导很多并非原创, 而是“进口”的。然而却可以欺骗很多数学素质较差的人, 这就是那些大V粉丝多的原因。
天文学可以预测日食, 而气象学给出天气预报。前者是有非常精确的证明的, 后者却只是“大概率”地保证。两者都是有科学根据的, 但有所不同, 用数学的语言, 可以说是定理和推测的区别。
在数学领域有很多定理和“猜想”。哥德巴赫猜想 (Goldbach's conjecture) 和黎曼猜想 (Riemann hypothesis) 都是著名的猜想, 尽管所用的术语不同 (Riemann hypothesis 忠实于原文的译文是“黎曼假设”, 但 hypothesis 和 conjecture 在意义上并无不同)。费尔马大定理 (Fermat Last Theorem) 原来也是猜想, 直到上个世纪末才得到证明, 所以现在可以称为定理。
定理都是有证明的。尚未证明的断言只能称为猜想。但在数学中乃至其他科学中, 猜想并不是毫无根据的断言, 虽然没有证明 (proof) 却有“证据” (evidence)。就以上述两个猜想为例。哥德巴赫猜想是: 任何大于2的偶数都可以分解为两个素数 (即质数) 的和; 黎曼猜想是: zeta 函数的每个非平凡零点的实部都是 0.5。这两个猜想都有两方面的证据: 一是大量的计算都未发现错误; 二是研究得到很多对猜想断言的“逼近”结果。对于哥德巴赫猜想, 目前最接近的结果是陈景润的“1+2”, 即任何大于2的偶数都可以分解为两个数的和, 其中一个数是素数而另一个是至多两个素数的积; 对于黎曼猜想, 目前最接近的结果是至少有 1/3 的非平凡零点的实部是 0.5。
举这些例子是为了说明, 即使“推测”也需要有根据, 否则就和欺骗没有区别了。例如断言“感染率达到60%-70% 可形成群体免疫”就毫无根据 (不仅没有证明也没有证据)。
从一个误差很大的前提出发, 经过推导所得到的断言不仅未必有意义, 甚至可能是荒谬的。举个例子: 如果通过调查判断甲公司的资产约为 110万元, 乙公司的资产约为 120万元, 误差不会超过50% , 那么这两个数据都是有用的; 但如果由此推断乙公司的资产约比甲公司多10万元, 就完全不靠谱了, 实际上的差别很可能远比10万元大, 甚至可能乙公司的资产比甲公司多一倍或少一半。
所以上面所说的那些大V对于新冠的“推测”都加了引号。
举个这类推理的例子: 新冠的死亡率“据推测”可能只有 1% , 那么隔离很多人是不明智的, 应该让大家都感染, 等到那 1% 都死了就没事了。这就是“群体免疫”的“理论根据”。
只要是初中数学素质达标的人, 稍微想想就会发现这个推理过程漏洞百出。首先, “死亡率 1% ”只是研究过程中 (某篇论文中) 提出的一种可能性, 不能作为推理的前提; 其次, “1% 死了剩下的就没事了”的所谓“群体免疫”完全没有科学根据, 只是与历史上的几次大流行病的情况类比而已, 然而医学领域已经发现新冠与以往的各次流行病有非常显著的不同, 所以类比未必成立, 就如由费尔马大定理可证明推断哥德巴赫猜想或黎曼猜想也可证明; 再次, 即使 1% 的人死亡也是现代社会无法承受的。
这里采用了不止一个不可靠的前提, 即使推导出“1+1=3”或“太阳从西边出”也不奇怪。
遗憾的是能迅速发现这个数学欺骗的人太少, 这说明数学素质的提升仍任重道远。
尽管“群体免疫”之类的主张是没有科学根据的, 某些大V们却津津乐道, 张口闭口“据推测”如何如何, 而且还有更进一步的推导, 例如: 既然有“群体免疫”论, 那么中国没搞“群体免疫”就是根本性的错误, 将来全世界除了中国都“群体免疫”了, 那么中国就是唯一害怕新冠的国家, 甚至因此亡国, 等等等等。然而很多数学盲粉丝被骗到这个地步还执迷不悟。
有的大V甚至张口闭口“我推测”如何如何, 一时间仿佛骤然冒出很多预言家, 难免令人惊叹“厉害了我的国”。
具有强烈讽刺意义的是: 这些大V能够这样乱喷, 恰恰是因为他们住在中国, 避免了“群体免疫”的危险, 否则它们只会忙于如何逃避那“1%”的“死亡率”。
还是那句老话: “中国现在最不缺的就是骗子”。
普遍提高公民的数学素质, 一个效果将是形成对于骗子的“群体免疫”。
4. 一般人所需要的一个数据: 危险因子
现在回到前面所说的对于疫情“一般人需要的数据”。
其中一个重要的数据是因新冠死亡的人数占总人口的比例。一些文献中将这样的比例数称为“危险因子”, 我们下面采用这个术语。
先说武汉。武汉人口约有 1700 万人 (其中有约 500 万人在春节期间离开了武汉), 后来因感染新冠死亡的约有 3600 人, 新冠危险因子约为万分之 2.1。
如果您觉得这是个很小的数, 那您的心真大。我们下面举几个例子来帮助您理解死亡因子的大小。
先看交通事故。我国每年因交通事故死亡的人数占总人口数的万分之0.6-0.7, 这显著高于很多国家, 例如德国每年因交通事故死亡的人数占总人口数不到万分之0.4。所以我们还需要继续完善交通法规建设, 改进道路和交通设施, 加强交通安全教育, 提升交通执法水平等等, 任重道远。如果您还想比较一下其他地方, 包括您认为交通更不安全的地方, 也可以在网上查到。例如印度每年因交通事故死亡的人数占总人口数的万分之1.1-1.2 (信不信由你)。
请注意这里说的是一年的交通死亡人数, 而武汉新冠大约在两个月中就达到了上述死亡人数。
再来看战争。美国在3年朝鲜战争中死亡的人数, 约占当时美国总人口的万分之3; 在14年越南战争中死亡总人数, 占当时美国总人口不到万分之3。在17年阿富汗战争中, 美军死亡总人数占美国总人口不到万分之0.1; 另一方面, 阿富汗平民死亡的总人数占总人口的万分之8-9。
与此比较一下就可以理解, 对于流行病, 危险因子若达到万分之2是大得可怕的。
何况交通事故和战争都没有传染性。
请注意每一个人死亡都会伤害一家人, 而且一般会有至少数十个亲友感到悲痛。如果危险因子达到万分之2, 社会的医疗体系和一些其他方面会不堪重负甚至崩溃。我们知道武汉的新冠疫情是靠全国支援才得以控制住, 否则很快就会走到不得不“选择性放弃”的悲惨境地。
对于安全, 常言道“不防一万, 只防万一”。如果某个地方新冠危险因子已超过万分之一, 建议您千万别去了。
遗憾的是, 在网上经常见到的很多数据对一般人没什么用, 例如上面说的“死亡率”。而很重要的危险因子却难以查到, 一般只能自己计算。这不很难, 因为能查到的死亡人数多半比较可靠, 总人口数就更可靠, 剩下的只需要小学数学即可。
例如在那个最早实行“群体免疫”的国度, 新冠危险因子已接近万分之6; 而一个被很多大V吹捧为“群体免疫完全成功”的“榜样”, 新冠危险因子也已超过万分之4。
5. 尾声
苦口婆心地讲了那么多数学, 如果您对本文所说的数学欺骗仍然执迷不悟, 而且勇敢地奔赴某个您认为“先进”的地区参加“群体免疫”的壮举, 那么万一 (其实概率不止万分之一) 您因感染新冠而“光荣”了, 拜托您在遗言中别说您的数学是语文老师教的 ------ 语文老师不背这个锅。
附注
这篇文章写于 5 月 15 日。随着时间的推移, 越来越多的人认识到危险因子才是对于新冠应该特别关注的指标, 而文中所说的利用“死亡率”数学欺骗也越来越不灵了。例如近日记者乔纳森·斯旺采访特朗普时, 坚持用危险因子衡量新冠疫情的严重程度, 而特朗普坚持用“死亡率”被斯旺屡屡驳斥。
文中所说的两个多月前的新冠数据, 近日的进展是: 英国的危险因子从将近万分之 6 上升到超过万分之 7; 瑞典的危险因子从万分之 4 上升到近万分之 5.7; 美国的危险因子从不到万分之 3 上升到超过万分之 4.8, 总人数超过 16 万。而美国因二战死亡的人数 (主要是军人) 约为 38 万, 其中在亚太地区死亡人数约为 12 万。