健康与统计
本文选自《中国统计》2021年第12期文章,原文已获出版社和作者授权。
具肉体凡胎,食五谷杂粮,人们焉能不生小疾大病。疾病防控、生殖健康、食药安全、营养均衡、老有所养都是卫生与健康事业关心的重要内容。享有更好的医疗卫生服务、更放心的食品药品是人们追求的美好目标。在实现这些目标的过程中,方法设计、途径选择、效果评价、战略决策等方面都离不开统计学的参与。统计学是对带有随机性质的数据资料进行整理分析,推断事物自身以及它们发展变化的规律,进而进行决策的科学。而卫生健康事业的每个环节每个部分都会产生带有随机性质的数据,而每个行动和每项政策则都应该根据数据分析结果进行科学决策和制定。本文就来说一说卫生健康中的统计学。
1. 预期寿命和寿命表
人们都希望健康长寿,寿命无疑是衡量健康水平的重要指标。然而跟踪记录一个人的寿命是比较难的事情,而且一个人的一生中通常要经历许许多多的事情,一个人的真实寿命无法反映某个时间点的情况。因此人们转而研究预期寿命,预期寿命定义为按照当下的生活状况,一个人将要生存的平均寿命或者期望寿命。它是衡量一个社会当下卫生健康水平的重要标志,综合反映了现时社会进步发展的程度和水平。预期寿命可以通过寿命表法来估计。寿命表中的数据是通过调查得到的,通常是某个区域内一年长度时间段开始和结束时按年龄统计的人口数,统计时一般按照每岁分为1个年龄段。有时为表达简略,会将年龄段进行合并,分为5岁或者10岁1个年龄段。根据寿命表数据,刨去迁移进出人数,估算出按年龄段生存率或者死亡率,把这个统计结果,看成一个人将要经历的生存率和死亡率,进而计算出预期寿命。2020年10月,国新办发布“十三五”卫生健康事业改革发展情况,从2015年到2019年底,中国居民人均预期寿命从76.3岁提高到77.3岁,4年提高了1岁。由于平均预期寿命的增长通常是很缓慢的,这是非常大的成就。根据资料显示,2020年美国人均预期寿命为77.3岁,韩国人均预期寿命为83.5岁。我国还有很大的上升空间。我们相信,随着国家全面的进步,卫生健康措施不断完善,人们生活水平不断提高,我国平均预期寿命将能够很快达到世界的最前列。
2. 药效评价
药效评价是决定一个药品是否能上市的关键,这个过程牵涉到很多问题。我们这里只谈一下根据盲法试验数据进行有效性评估的部分。药效的评价往往采用安慰剂对照和盲法试验采集数据。将新药和安慰剂随机分配给病人。分配的状况病人和医生在试验结束前都不会知情,这称为盲法试验。
如果药物的作用只是分为有效和无效两种结果,则利用统计假设检验思想,利用试验结果中试验组和对照组中的有效率来进行判定,如果新药的有效率比安慰剂的有效率明显的高,则可以判定新药是有效的。如果如果药物的作用是通过治愈时长或者寿命来衡量,则利用统计假设检验思想,利用试验结果中试验组和对照组中的平均时长来进行判定,如果新药的平均时长比安慰剂明显的占优,则可以判定新药是有效的。有时这种评价可能更加复杂,因为可能牵涉到一些影响因素,而这些因素在对照组和试验组中很难平衡。则需要引入更加复杂的模型去除这些因素的不均衡的影响后再进行比较。
3. 生殖健康
生殖健康关系到人们的生活的重要方面。统计的应用首先包括指标的选取和估计。举例来说,已婚适龄产妇比,育龄妇女怀孕率,育龄妇女避孕率,新生婴儿死亡率,婴儿性别比等等都是重要的指标。统计的运用还可以用于分析比较。比如利用这些指标对不同地区进行归类分析,比较这些地区状况或水平。还可以根据数据分析新生儿死亡率在各个医院或者地区是否有差别,分析这些差别是由哪些因素造成的,是否有些医院表现为不正常的高。有关分析结果可以指导医院进行改进提高。还可以分析某个地区的婴儿性别比是否属于正常范围,如果不正常需要分析原因,进而弥补监管漏洞。
4. 食品安全
每到夏季由于气温增高食品安全事件会增多。食品安全是老百姓日常最关心的问题之一。有关部门需要对食品安全进行风险分析,从而制定相应政策法规。食品安全事件原因来源广泛。在食品的种植、采收、加工、运输、存储、售卖的各个过程都存在着风险。有些风险是自然风险,有些风险是人为风险。需要利用统计方法进行风险因素分析,对危险因素进行排序,并制定策略对主要危险因素进行全程控制,达到降低风险杜绝或减少食品安全事故的目的。在这个过程中统计模型和方法可以用到很多。比如描述时空变化的非齐次泊松过程模型用来描述食品安全风险随季节和地区的变化规律。在其中加入变量的影响分析,可以分析不同食品受温度和降雨等因素的影响。
5. 疾病防控
联合国2030可持续发展议程将心脑血管疾病、癌症、慢性呼吸系统疾病、糖尿病做为最主要的四大类慢性非传染性疾病,并把降低这四类重大慢性病导致的过早死亡率作为重要的发展目标。一般来说,良好的生活方式,积极的治疗方法和精准的健康管理都会降低死亡率。对不同的生活方式,不同的治疗措施和不同的管理方法的效果比较分析需要进行试验设计和数据分析。由于伦理限制,这时很多试验不能够像药效评价一样进行双盲试验。甚至我们不能进行试验设计,而只是被动的收集数据。这给数据分析带来一定的困难,建模和数据分析必须根据数据的特点来进行。
新冠肺炎、艾滋病、结核病等重大传染病防控事关社会发展和生命安全。这些传染病的传播方式不同,传播范围不同,危害程度不同。在新冠肺炎防治方面中国取得了丰富经验,获得了显著成效。这些经验能否应用到其它传染病的防治工作中需要进行探讨研究。根据传播规律和防治措施,潜伏期预测、被感染人数预测都是重要的统计分析工作,这对于物品调配和医生动员是非常必要的。资源配置分析、防治措施分析和效果评价也都是非常重要的统计任务。
6. 膳食营养
俗话说民以食为天,又说众口难调。有人喜欢粗茶淡饭,有人食不厌精脍不厌细,每个人都有自己的饮食习惯。怎么样的饮食才是好的饮食,对人们的健康才是有利的。这需要以现代科学的观点加以审视。由于饮食对健康的影响掺杂了很多的其它影响因素,所以很难直接表现出来,它们的作用往往隐藏在众多因素当中。这就更加需要统计方法加以挖掘分析。这是统计方法的一个很好的用武之地。历史上曾经有关的蛋黄影响人体胆固醇的问题,目前仍然没有搞清楚的食用动物油还是植物油的问题,全麦粉和精面粉的问题,粗粮和细粮的问题,蔬菜和肉类比例问题等等,这些问题都需要一个很好的试验设计方案,并在获得数据后加以比较分析。比如说食用动物油和植物油的比较问题。在动物试验阶段可以采取的方法很多,比如按照植物油的比例分别为0、0.25、0.5、0.75、1的方式把试验用动物分为5组,然后开展试验。获得的数据也容易进行比较,得出孰优孰劣的结论。在对人的试验阶段就比较复杂,数据只能采取问卷调查的方法获得。分析起来还需要考虑混杂因素的影响。
7. 战略决策
任何一项重要的战略决策都可能影响到资源的配置不同和利益分配的变化,都期望获得良好的效果。在国家的大数据发展战略中指出,公共政策要基于数据分析的结果。这其中要分析不同策略带来的效果和风险分析。要通过统计分析掌握哪些因素比较敏感,微小的变动就会带来巨大的影响;哪些因素没那么敏感,微小的变动不会带来很大的影响。通过谨慎调整敏感因素,大胆调整不敏感因素,达到科学决策的目的。
8. 总结
卫生健康领域的问题是统计理论发展的一个重要推动力。反过来,统计的思想方法在卫生健康领域有着广泛的应用。这种应用既有宏观层面的,也有微观层面的,既有技术细节的也有战略决策的,其中可以涉及到几乎所有的统计模型和方法。我们挑选了几个有代表性的问题进行了阐述。
作者简介
房祥忠教授
在北京大学数学科学学院曾任概率统计系主任,中国现场统计研究会理事长,IMS-China主席。现兼任教育部统计学类教学指导委员会主任委员,中国统计学会副会长,全国应用统计专业学位研究生教育指导委员会委员,北京企业评价协会理事长等职。研究兴趣包括:生存分析,可靠性,纵向数据,基尼系数,时空统计,人工智能中的统计方法等。在《中国科学》《JRSP》《Reliability on IEEE》等期刊发表论文50余篇。曾获国防科技奖二等奖(2011)、北京市科技进步二等奖(2002)和教育部第六届高等教育国家级教学成果二等奖(2012)。
敬告各位友媒,如需转载,请与统计之都小编联系(直接留言或发至邮箱:[email protected]),获准转载的请在显著位置注明作者和出处(转载自:统计之都),并在文章结尾处附上统计之都微信二维码。
编辑|赵霖琳
微信扫码关注该文公众号作者