Science:迄今最大规模的全基因组测序数据发现58种导致癌症的新突变
近日,国家癌症中心在《国家癌症中心杂志》(JNCC)上发布中国最新癌症报告《2016年中国癌症发病率和死亡率》。
报告显示,2016年中国约有406.4万例新发癌症病例,以及241.35万例死亡病例。根据报告数据估算,我国平均每天有超过1.11万人被诊断为新发癌症,有将近6600人因癌症死亡,每分钟有8个人患癌。
突变特征(mutational signature,也译为突变信号、突变标记或突变签名)使人们了解每名患者所患癌症的环境原因和内源性原因。癌症基因组测序研究允许对突变特征进行探索。
来自英国剑桥大学的研究人员进行了迄今为止样本规模最大的一项全基因组测序研究,揭示出数十种过去未知的肿瘤突变特征,进一步扩宽人们对癌症发病原因的认识。相关研究结果发表在2022年4月22日的 Science期刊上,论文标题为“Substitution mutational signatures in whole-genome–sequenced cancers in the UK population”。
每个器官都包含数量有限的常见单碱基取代(SBS)突变特征(通常在5到10个之间)。常见突变特征的数量与队列规模无关。相比之下,罕见突变特征的数量取决于样本大小,因为检测到罕见突变特征的可能性是其人口发生率的一个函数。同样的生物过程在不同的组织中产生的突变特征略有不同,这凸显了突变特征的组织特异性。
常见和罕见突变特征的发现和应用,图片来自Science, 2022, doi:10.1126/science.abl9283。
在这项研究中,研究人员对通过英国国家卫生服务系统(NHS)为十万人基因组计划(100,000 Genomes Project)前瞻性地收集的12222例经过全基因组测序的癌症进行突变特征分析。并通过对两个公开的队列的数据--国际癌症基因组联盟(International Cancer Genome Consortium, ICGC)的3001例原发性癌症和哈特维希医学基金会(Hartwig Medical Foundation)的3417例转移性癌症--进行独立分析来验证。
研究人员先对12222 名患者进行了 WGS突变特征分析,在每个器官中独立地鉴定了单碱基取代(SBS)和双碱基取代(DBS)特征。并利用这个异常庞大的队列,开发了一种方法来增强对罕见、低频诱变过程的常见突变过程的区分。
图:癌症特征突变分析(来源:Science)
之后,研究人员通过对来自上述的两个公开可用队列的数据进行独立分析来验证。最后,得到了82个高置信度的SBS参考突变特征和27个高置信度的DBS参考突变特征。随后,他们将这些参考突变特征与以前报道的突变特征进行了比较,分别发现了40个和18个以前未被识别的SBS和DBS突变特征。
剑桥大学研究助理、论文第一作者Andrea Degasperi博士说:“全基因组测序为我们提供了导致每个人癌症的所有突变的全貌。每种癌症都有数千个突变,我们拥有前所未有的能力来寻找患者的共性和差异,在此过程中,我们发现了 58 个新的突变特征并拓宽了我们对癌症的认识。”
鉴于突变特征的复杂性不断增加,并希望能让普通用户使用,因此研究人员开发了一种叫做Signature Fit Multi-Step(FitMS)的算法,在新样本中寻找突变特征,同时利用他们最近的发现。在第一步中,FitMS检测常见的器官特异性的突变特征;在第二步中,它确定是否还存在额外的罕见突变特征。
综上所述,对18640例癌症的突变特征分析,是迄今为止最大的经过全基因组测序的样本队列,需要方法上的进步,允许知识的扩展。研究人员确定了许多以前没有报道的突变特征,并建立了常见突变特征和罕见突变特征的概念。FitMS算法的设计是为了利用这些进展来帮助用户在新的样本中准确识别突变过程。
参考资料:
Andrea Degasperi et al. Substitution mutational signatures in whole-genome-sequenced cancers of the UK national health service. Science, 2022, doi:10.1126/science.abl9283.
上万科研人员交流基地,扫码加入“科研交流群”,找到组织,让科研更轻松!
微信扫码关注该文公众号作者