Redian新闻
>
Nat. Commun. | 浙江大学郭国骥/韩晓平/王晶晶团队基于单细胞图谱和人工智能神经网络的基因组变异解码框架

Nat. Commun. | 浙江大学郭国骥/韩晓平/王晶晶团队基于单细胞图谱和人工智能神经网络的基因组变异解码框架

公众号新闻

自人类基因组计划完成20年以来,基因组学的研究取得了相当大的进展。然而,由30亿碱基对组成的人类基因组序列绝大部分都是非编码区域,人们对其潜在功能的理解只是冰山一角。在过去的十年中,大量工作致力于在全基因组尺度上研究基因表达的遗传调控机制,表达数量性状位点(eQTL)及其靶基因(eGenes)的发现弥补了复杂表型全基因组关联研究(GWAS)的局限性,使其进一步的临床应用成为可能。尽管如此,在GWAS所确定的与复杂表型相关的非编码突变中,有相当一部分无法通过已知的eQTL位点获得功能注释,人们对位于非编码区的遗传变异的理解仍然非常有限。组织样本中的细胞异质性也限制了人们对非编码突变功能的更深入理解。

2023年6月30日,Nature Communications在线刊登了浙江大学郭国骥/韩晓平/王晶晶团队的学术论文“An analytical framework for decoding cell type-specific genetic variation of gene regulation”。该研究提出了一种新颖的分析框架Huatuo(华佗),可仅依据来自少量生物学个体的基因表达谱,实现对突变转录效应在细胞类型水平上的推断,为解析复杂的基因表达遗传调控机制提供了一种高效途径。该研究进一步构建了一个全面的细胞类型特异性基因调控遗传变异景观,并通过各种基准测试验证了分析结果的合理性。最后,团队探索了基因组遗传变异与复杂表型之间的关系,为复杂性状和疾病的驱动细胞类型和因果变异提供了系统性见解。

在这项研究中,研究人员在方法学上进行了两个方面的扩展。首先作者提出了一种基于单细胞表达谱推断细胞亚群依赖性eQTL的新方法,以揭示更多在传统分析中被掩盖的非编码突变与基因之间的关联。其次作者改进了现有的深度学习模型,提出了一种基于单细胞表达谱建立细胞亚群特异性预测模型的方法。通过模拟DNA序列的碱基替换,该模型可以预测突变在每个细胞亚群中的转录破坏效应。最后,作者将这些方法整合到一个名为Huatuo的框架中,并开发成一个工具供广大研究者使用。该框架可以利用少量生物学个体的scRNA-seq数据,探索细胞图谱和全基因组范围的细胞类型特异性基因调控遗传变异。

为了证明分析方法的可行性,研究人员首先对Huatuo模型的预测表现进行了系统性的评估。作者发现,Huatuo模型能够直接基于DNA序列准确预测基因表达的水平。对于来源于20个不同组织的357个细胞亚群,测试集基因的预测和实际观察到的基因表达水平之间的皮尔森相关系数(PCC)中位数达到了0.763,而在肾脏、胃和横结肠的某些细胞亚群模型中,PCC甚至超过了0.80(图左)。接着,为了检测突变效应预测结果的合理性,作者还测试了模型是否可以仅基于DNA序列重现基于人群数据得到的eQTL结果。尽管一些转录破坏效应非常大的位点可能由于负向选择作用在人群中极其罕见,进而导致eQTL统计力度的不足,但测试结果仍然显示,在同一个连锁不平衡区域中,突变预测效应的最高绝对值和eQTL z-score大小表现出显著的相关性(图右)。

此外,研究人员也对细胞依赖性遗传关联的分析结果进行了检测。通过对114套GWAS数据集进行贝叶斯共定位分析,作者发现Huatuo计算出的cell cluster-ieQTL能够揭示那些在使用标准eQTL分析时无法检测到的共定位信号(图左)。然后,作者使用了GWAS性状因果基因的“银标准”数据集,将其与cell cluster-ieQTL揭示的共定位基因进行比较。与预期一致,作者观察到,具有更高PP.H4的GWAS性状-基因对在“银标准”数据集中显著富集(图右)。总的来说,这些结果显示了Huatuo推测的cell cluster-ieQTL结果在生物学上是合理的。

通过应用Huatuo框架,研究人员推测了细胞依赖性eQTL以及人群中所有常见突变在不同细胞亚群的调控效应。最终,作者构建了44种主要细胞类型的特异性基因调控遗传变异景观。该景观覆盖了人体主要组织类型和细胞谱系,包含13182个具有调控功能的非编码突变,以及6181个表达水平与之相关的基因。

最后,利用114个GWAS数据集,研究人员全面评估了Huatuo景观对各类复杂疾病和性状的遗传力贡献。基于Huatuo景观,作者估计了GWAS数据的SNP遗传力在细胞类型特异性调控位点的富集情况,并证明了其在揭示疾病驱动细胞类型方面的潜力。此外,作者还为精细映射推断的GWAS因果突变提供了单碱基和细胞类型水平的功能机制的见解。为了更好地展示这些结果,作者构建了Huatuo遗传变异的数据库网站(https://bis.zju.edu.cn/huatuo/),以促进生成的数据资源在未来研究中的应用。


【结论与展望

总之,该研究克服了当前因技术方面的不足和样本收集困难所导致的瓶颈,提供了一个解码非编码突变功能和研究疾病基因组的新范式。这些研究结果将推动功能基因组学领域的进展,为阐明对疾病发生至关重要的细胞通路以及实现精准医疗和个性化医疗奠定基础。

浙江大学基础医学院郭国骥教授、韩晓平教授和良渚实验室王晶晶研究员为本文的通讯作者。浙江大学基础医学院2020级博士生肖彦宇良渚实验室特聘研究员王晶晶、浙江大学基础医学院2019级直博生李佳琦和浙江大学基础医学院博士后张霈婧为本文共同第一作者。研究获得了国家重点研发计划、国家自然科学基金的支持。

原文链接:https://www.nature.com/articles/s41467-023-39538-7

来源:BioMed科技

往期推荐
1. 中国青少年饮酒率惊人!研究发现酒精比非法药物危害更大!
2. 高福解读:对抗新冠病毒的新希望——高效新冠疫苗的新突破
3用病毒治疗癌症!最新研究用放疗联合病毒治疗脑癌,治愈率高达66.7%!
4张文宏:面对长新冠,或许我们需要“让子弹再飞一会”
  
生命科学综合交流QQ群:681341860

微信学科群:神经科学群、医学、基础科学等纯科研交流群、硕博交流群和医药投资交流群(微信群审核要求较高,请各位添加小编后主动备注单位研究方向): 


小编微信

注:添加小编请备注昵称+单位+研究


喜欢本篇?让我们知道你“在看”吧!


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
用别的模型权重训练神经网络,改神经元不影响输出:英伟达神奇研究Nature Communications | 浙大周如鸿团队发文阐明新冠病毒RNA顺式作用元件SL3与人体关键蛋白作用机理Nat Commun|中国医学科学院和香港大学合作揭示SARS-CoV-2 SUD 结构并提出新抗病毒策略GPT的背后,从命运多舛到颠覆世界,人工神经网络的跌宕80年玉兰花,高尚纯洁液态神经网络无人机在未知领域航行时击败了其他人工智能系统Nature | 构建出迄今为止最详细、最全面的人类心脏细胞图谱,为心脏健康和疾病提供了新的见解名诗新解Adv. Funct. Mater.:提高基于单层分子修饰的宽带隙钙钛矿太阳能电池效率Nat Commun. | 哈兽研首次发现非洲猪瘟不同基因型间自然重组病毒喜报 |我国科研团队发现阿尔茨海默病新致病基因、汤姆猫与浙江大学生物医学工程研究所等共同推进脑机接口产学研工作Biomaterials Advances︱戴建武团队基于生物材料的心脏类器官研究进展ICML 2023 | 英伟达神奇研究:用别的模型权重训练神经网络,改神经元不影响输出Science|首次构建出衰老果蝇细胞图谱,揭示身体中不同类型的细胞以不同的速度衰老中国人泛基因组图谱上Nature引争议,基因数据究竟该不该共享?Nature:有史以来最大的人类正常乳腺细胞图谱为乳腺生物学带来了前所未有的新见解​ICLR 2023 高分论文 | 基于子图草图的图神经网络用于链路预测Nature Communications | 脑机接口新进展!清华大学柔性电子技术实验室在耳内柔性三维神经电子领域取得重要进展Science Bulletin| “女娲”基因组资源发布中国汉族人群基因组近期适应性选择的最新发现Nat Commun | 新研究表明一种经过改进的CAR-T细胞有望治疗卵巢癌等实体瘤Science | 邢栋课题组利用单细胞多组学技术揭示三维基因组与基因表达的关系Nat Commun | 科学家绘制出了迄今为止最深入的健康肠道菌群从母体转移到婴儿体内的图谱单细胞测序的成本太高了?如何用单细胞发6+SCI?这五个宝藏单细胞数据库可以帮到你!Nature Catalysis | 上海科技大学季泉江/西湖大学申怀宗开发出新的微型高效的基因组编辑器Nature子刊 | 浙江大学祝赛勇团队实现迄今最快的细胞化学重编程Nature Communications | 颜光美教授团队开发出新一代溶瘤病毒M1,药效提升近一万倍Nat Rev Genet:单细胞基因组学转化为临床应用,到了关键的临界点!Nat Commun. | 在猪体内检测到基因I型和II型重组的高致死性非洲猪瘟病毒中国远征军 第2集 (黄志忠、张丰毅、柯蓝、谭凯 领衔主演 )ICML 2023 | 英伟达神奇研究:用别的模型权重训练神经网络,改神经元不影响输出!Singapore/新加坡书写系统随感Nat. Commun. | 夏宁邵团队揭示鼻喷流感病毒载体新冠疫苗诱导的呼吸道广谱免疫机制我们是大唐盛世 第二十九章 海岛度假1中山大学开源Diffusion模型统一代码框架,推动AIGC规模化应用人工智能立法提上日程:兼顾安全与发展,为人工智能治理打下框架性基础
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。