Nature |利用6156个人类基因组序列成功构建出人类基因组约束图谱
每个人的基因组都有数百万个基因变异,但大多数变异几乎没有影响,这使得临床医生很难根据基因差异进行医学诊断。
在一项新的研究中,由来自美国麻省总医院和布罗德研究所的研究人员领导的一个研究团队利用数万个具有全基因组序列数据的个体的基因变异模式,确定了基因组中缺乏典型变异的区域,这表明它们是进化和自然选择过程中保守的重要序列。这表明当一种基因变异出现在其中的一个区域时,它更有可能对个体的健康产生影响。相关研究结果于2023年12月6日在线发表在Nature期刊上,论文“A genomic mutational constraint map using variation in 76,156 human genomes”。
论文共同通讯作者、麻省总医院医学系分析与转化遗传学部助理教授和布罗德研究所副成员Konrad Karczewski博士说,“我们试图研究自然选择如何在整个基因组中塑造人类基因变异的模式,特别是在基因组的非编码区域中,对非编码区域的表征远不如基因组中的蛋白编码区域。虽然我们之前的研究工作评估了基因组中2%的编码基因,但我们的新方法扩展到了整个基因组,极大地扩展了我们对哪些功能性的基因组元件可能存在具有潜在临床意义的变异的了解。”
Karczewski和他的同事们将76156个人类基因组的信息聚合和处理到基因组聚合数据库(Genome Aggregation Database,gnomAD)中。gnomAD是一个大型的国际人类基因组参考资源,而且一直在不断扩大并向公众发布。该数据库中的遗传变异一直在帮助世界各地的临床实验室进行罕见病的诊断,此次发布极大地扩展了在非编码区域进行诊断的能力。
这些作者利用这些结果构建了一种针对全基因组的“基因组约束图谱(genomic constraint map)”。他们称之为Gnocchi(Genomic NOn-Coding Constraint of HaploInsufficient variation)。该图谱显示了基因组的哪些区域受到“限制”,这意味着当该区域发生变异时,它们往往破坏性太大,并通过自然选择从种群中剔除。
图片来自Nature, 2023, doi:10.1038/s41586-023-06045-0。
这些作者发现,受限制的区域富含与复杂人类疾病和性状有关的调节元件(控制基因表达)和遗传变异。他们还发现,更多的受约束的调控元件往往会调控更多受约束的蛋白编码基因,这反过来表明研究非编码约束可以帮助识别受约束的基因。
Karczewski解释道,“我们预计Gnocchi可能用于优先考虑在罕见病患者得基因组非编码区中发现的遗传变异,这可能为疾病的遗传原因和靶向治疗提供线索。”
接下来,将其他个体的基因组信息添加到这个新开发的数据集中是很重要的。Karczewski说,“未来致力于建立一个更大、更多样的人类参考数据集,将进一步改善所有人的罕见病诊断,并构建更好的约束指标,从而让我们更好地了解人类基因变异的分布和影响。”
参考资料:
Siwei Chen et al. A genomic mutational constraint map using variation in 76,156 human genomes. Nature, 2023, doi:10.1038/s41586-023-06045-0.
Using 76,000 genomes, researchers build new map of regions of the human genome under natural selection
https://www.broadinstitute.org/news/using-76000-genomes-researchers-build-new-map-regions-human-genome-under-natural-selection
微信扫码关注该文公众号作者