Redian新闻
>
多组学数据整合更精确,川大团队借助迁移学习揭示细胞异质性可用于改善数据整合

多组学数据整合更精确,川大团队借助迁移学习揭示细胞异质性可用于改善数据整合

公众号新闻
©作者 | 李云帆
单位 | 四川大学



单细胞多组学数据整合旨在减少组学差异,同时保持细胞类型差异。然而,由于细胞异质性,建模和区分这两种差异是一项艰巨的任务。即使是相同组学和类型的细胞也会具有不同的特征,从而使这两种差异变得不明显。
在最新的研究中,四川大学的研究团队揭示了细胞异质性的两面性,尽管通常被视为数据整合的干扰,但若妥善利用,可以反之用来改善数据整合。据此,团队提出了一种以异质方式整合细胞的多组学数据整合方法,称为 scBridge。
研究以「scBridge embraces cell heterogeneity in single-cell RNA-seq and ATAC-seq data integration」为题,于 2023 年 9 月 28 日发布在《Nature Communications》。

论文链接: 

https://www.nature.com/articles/s41467-023-41795-5




背景

单细胞RNA测序技术(scRNA-seq)通过分析各个细胞的基因表达,揭示细胞多样性、疾病机制和药物响应等重要信息,在生物学和医学领域取得了广泛的应用。
近年来,单细胞测序技术的发展提供了除RNA以外更多组学的单细胞分析,例如染色质可及性(scATAC-seq)、空间转录组(Stereo-seq)和蛋白质组(ScoPE-MS)。
多组学数据有助于构建全面的分子调控网络,促进精准医学的发展。其中,scATAC-seq通过鉴定开放的染色质区域来研究染色质结构的动态重塑,有助于揭示转录的内在机制。因此,整合scRNA-seq和scATAC-seq让我们可以不仅从转录水平,还可以进一步从表观遗传学的角度揭示差异背后的原因。
然而,由于不同组学测序方法的技术手段不同,所测得的数据在生物学信息之外还有测序技术、平台等带来的噪声,多组学数据整合方法旨在消除组学间的差异,保留生物学信息,使来自不同组学、相同类型的细胞聚合到一起,以便进行下游分析。



方法

本文提出的基于异质迁移学习的单细胞多组学整合方法,接受已注释的scRNA-seq细胞和未注释、待整合的scATAC-seq细胞作为输入,最终输出多组学细胞的整合结果,及对scATAC-seq细胞的类型预测。

如图1所示,本方法主要由以下四个步骤组成:

(1)利用已注释的细胞训练分类网络,得到细胞表征和类别预测;

(2)根据不同组学细胞表征间的相似性和预测的置信度,对scATAC-seq细胞进行可靠性建模;

(3)选取高可靠性的scATAC-seq细胞与scRNA-seq细胞在特征空间进行整合;

(4)选取高可靠性的scATAC-seq细胞,将其当前类型预测结果作为注释,重复以上步骤直到全部scATAC-seq细胞都被整合。

▲ 图1. scBridge 算法示意图(来源:论文)




创新性
多组学数据整合的核心在于根据测序数据的特征分布,区分生物学信息和非生物学噪声。然而,由于细胞异质性的存在,即使来自相同组学、相同类型的细胞也会表现出不同的数据特征。
此前的多组学数据整合方法未充分考虑细胞异质性,其对于生物学信息和非生物学噪声的区分受到细胞异质性的干扰,从而导致次优的整合效果。不同于此前的方法,本文提出细胞异质性不再是对数据整合的干扰,而是能被巧妙利用来帮助多组学数据整合。
具体地,我们观察到部分 scATAC-seq 细胞的染色质可及性和 scRNA-seq 细胞的基因表达之间具有更高的相关性,这些细胞间的组学差异较小,更容易被整合。此外,整合这些细胞能够在整体上减小组学差异,进而帮助其他细胞的整合。

基于此,我们提出了一个基于异质迁移学习的单细胞多组学整合方法 scBridge,通过迭代式地选取并整合当前组学差异最小的细胞,逐步减小组学差异,最终实现对所有细胞的准确整合。

▲ 图2. scBridge在SNARE-seq、SHARE-seq、10X Multiome 数据上的整合结果。(来源:论文)



结果

本文在七个单细胞多组学数据集上对所提出的scBridge方法进行了验证,涵盖了不同的物种、器官、细胞数量、测序方法、组学类型等。

图 2 展示了其在 SNARE-seq、SHARE-seq、10X Multiome 数据上的实验结果,可以看到 scBridge 相较于现有的多组学数据整合方法表现出更好的整合结果和 scATAC-seq 细胞注释精度,尤其是对于细胞个数较少的细胞类型。另外,实验表明 scBridge 对注释的 scRNA-seq 数据量要求较小,在只提供 50% 注释数据的情况下仍能实现准确的数据整合。

▲ 图3. scBridge 在模拟 Dropout Corruption 的 Human Hematopoiesis 数据上的整合结果(来源:论文)

为了探究 scBridge 对于测序数据质量的稳健性,本文分别在 scRNA-seq 和 scATAC-seq 数据上通过手动调节 Dropout 的比率,模拟了测序深度较低的情况。
图 3 的结果表明,scBridge 对于测序数据质量表现出良好的稳健性,尤其是在 scRNA-seq 端几乎不受 Dropout 事件的影响。这得益于 scBridge 所采用的迭代式整合策略,即便 scRNA-seq 数据的质量较差,但只要其能帮助模型选取出一部分可靠的 scATAC-seq 细胞,模型便可以利用这一部分细胞来进一步辅助其余细胞的整合。
此外,本文还证实了 scBridge 对于 scRNA-seq 细胞注释精度、组学间细胞类型差异等具备良好的稳健性,且能扩展到蛋白等其他模态数据的整合,更多结果和分析详见原文。



结语
总的来说,本文首次关注到细胞异质性对于单细胞多组学数据整合任务的两面性,基于细胞异质性这一生物学特性,针对性地在整合过程中对各个细胞的整合可靠性进行建模,迭代式地进行组学差异消减,最终实现准确的数据整合,是机器学习算法在生物信息分析中的一次成功应用。

更多阅读



#投 稿 通 道#

 让你的文字被更多人看到 



如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。


总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 


PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。


📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算


📬 投稿通道:

• 投稿邮箱:[email protected] 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿


△长按添加PaperWeekly小编



🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧


·
·

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
比马斯克脑机接口更精确微创,超声波读脑大法来了家常小炒:川味辣椒回锅鱼片 - 先炸后炒,香辣过瘾,回味无穷2023第六届单细胞多组学研究与应用研讨会成功召开,助力单细胞研究领域发展!市委中心组学习会传达学习习近平总书记贺信精神,专题学习城市工作重要论述华人团队首次分化出蓝斑去甲肾上腺素能神经元,效率最高达60%,可用于药物筛选学习平台|面向广大团员和青年开展学习贯彻习近平新时代中国特色社会主义思想主题教育华中科技大学团队开发细菌纤维素超声超构表面,可用于新型超材料【模板】Nature子刊:更精准设计,揭示大脑认知功能区的体积随月经而变化机器学习揭开了「原子几何」的奥秘,推动数学领域发展世界知名多组学科学家王融加盟品生医疗,加速全球化精准诊疗创新应用落地加州拟批准对枪弹征收新税 将用于改善学校安全TCR-T细胞治疗可用于感染新冠肺炎的移植病人Cell Metabolism | 沈少明、陈国强、苏冰团队揭示细胞感应氨基酸的新机制喝酸奶防抑郁!新研究揭示益生菌调节情绪新机制,有助于改善心理健康!Nature子刊 | 杜艺岭组发文揭示细菌来源的新型5-羟色氨酸生物合成途径并实现在细菌中从头合成人体激素褪黑素北大团队数据解析新方法:揭示新能源多时空尺度不确定性的奥秘马飞教授:德曲妥珠单抗突破肿瘤异质性,实现HER2低表达TNBC精准诊疗Nat. Commun. | 高歌课题组提出跨平台、多模态空间组学比对与整合方法红色日记 4.21-30Nat Commun | 四川大学赵瀛兰团队揭示抑制LSD1增强PARP抑制剂在卵巢癌中的敏感性​Sci Adv丨周溪团队揭示人巨细胞病毒对外源性细胞凋亡与抗病毒天然免疫的双重抑制机制不止延长寿命,还提升生育能力!熊波团队揭示:补充亚精胺可改善动物卵母细胞质量【9·10致敬全体教师】2023(第六届)单细胞多组学研讨会免费票速抢!统计局:下阶段房地产投资、销售、市场运行将逐步趋于改善基于影像多组学数据库的无创可视化新方法,揭示乳腺癌肿瘤内异质性表型和治疗靶点Nature|新方法一次性可以对动物体内的每个细胞进行不同的基因修饰明日开幕 | 2023(第六届)单细胞多组学研讨会上海嘉定开幕!提前还贷热潮,终于降温了!央行:预期得到实质性改善浙大团队用深度学习方法进行高效、准确的大型文库配体对接,助力药物开发七律-垂钓有吟FASEB Journal 唐颢课题组揭示细胞凋亡中DNA与RNA胞嘧啶甲基化修饰的对话调控作用宾州詹金斯植物园(Jenkins Arboretum),放松心情美丽的圣彼得堡冬宫Cell Reports | 胡薇薇/陈忠/蒋磊课题组发文揭示组胺H3受体调控情景恐惧记忆的细胞类型与亚细胞分布的空间特异性作用J. Med. Chem. | 复旦大学药学院谢琼副教授/王永辉教授团队发现可用于肿瘤免疫治疗的新型RORγt激动剂候选药物
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。