COMPUT METH PROG BIO | 生物学年龄预测模型的构建
人口老龄化日趋严重,且存在个体差异。现实生活中,有些人明显看着比同龄人年轻,而这些人实际的健康状况也优于同龄人。身患早老症个体由于基因变异,生存期短,其表现出的生物学年龄远大于实际的日历年龄,健康状况检测发现其端粒长度极短,同时伴随多个系统衰老和疾病的状态。因此,如何预判个体衰老和健康状态,及时采取有效的干预措施,是目前积极应对健康老龄化面临的重大挑战。
衰老是一个受到遗传和环境共同影响的复杂过程。已发现一些衰老的细胞和分子标志与年龄和健康状态显著相关。这些研究中的年龄,通常指日历年龄,即根据个体自出生以来经过的时间测量。不会因生活方式、健康或疾病的改变而变化。而可以衡量组织和机体功能衰退、与年龄相关疾病的风险、发病率和死亡率的生物学年龄虽然没有明确定义,但其并不等同于日历年龄。因此,对于生物学年龄的评估测算,可能为我们提供一种预测和评估疾病风险的依据。
2023年6月24日,来自国家卫生健康委北京老年医学研究所的博士后倪晓琳作为第一作者,与河北大学中医药信息学实验室赵汉青主任合作,国家卫生健康委北京老年医学研究所的原慧萍副研究员和广西壮族自治区江滨医院胡才友院长作为共同通讯,以“Development of a Model for the Prediction of Biological Age”为题在Computer Methods and Programs in Biomedicine杂志发表了文章,他们运用人工智能将性别、DNA甲基化水平、端粒长度和特定生理生化指标整合分析,从多维、系统的角度成功构建了生物年龄的定性模型和定量模型,为早期精准的预测和定量评估个体健康状况提供新的技术产品,也为临床及时干预和延缓衰老及其相关疾病的发生和发展提供科学的参考依据。
研究首先通过生理生化指标评估个体健康状况,从0-109岁年龄的人群中筛选定义标准人群,并将其他个体与标准人群比较,定义个体的生物学年龄大于日历年龄或生物学年龄小于日历年龄。然后,将样本分为训练集和验证集,将筛选出的年龄相关的22个候选指标(DNA甲基化、端粒长度和特定生理生化指标),纳入人工智能分析(如线性回归、lasso模型、ridge回归、bayesian ridge回归、elasticity网络、k近邻、线性支持向量机、支持向量机和决策树模型等),通过比较30种不同的分类算法模型,筛选出Bagged Trees可以最可靠的定性预测生物学年龄 (准确率为75.6%,AUC=0.84)。通过比较24种不同的回归算法模型,发现最可靠的生物学年龄定量预测模型是采用Rational Quadratic方法建立的 (R2=0.85, RMSE=8.731 years)。研究首次从多个维度,系统的构建了生物学年龄的定性模型和定量模型,为精准的健康和寿命预测提供了可能性。
原文链接:https://doi.org/10.1016/j.cmpb.2023.107686
参考文献:Ni, X., Zhao, H., Li, R., Su, H., Jiao, J., Yang, Z., Lv, Y., Pang, G., Sun, M., Hu, C., & Yuan, H. (2023). Development of a model for the prediction of biological age. Computer methods and programs in biomedicine, 240, 107686. https://doi.org/10.1016/j.cmpb.2023.107686
微信扫码关注该文公众号作者