ICLR 2023 | 初探AI拼图模型预测蛋白质复合物结构
分子表示学习在 AI 辅助药物发现研究中起着至关重要的作用。在传统药物研发中,常用的分子对接模型需要进行大量的构型采样与优化,并筛选出较为稳定的结构。这类策略效率较低,难以应用于高通量的蛋白质对接任务。本文介绍的基于分子表面黎曼流形的深度学习表示方法 (Harmonic Molecular Representation, HMR) 实现了更准确、高效的蛋白质对接模型开发。HMR 用二维黎曼流形建模分子表面,结合调合分析技术与神经网络实现流形上几何、化学信号的多尺度传播和两个蛋白质表面之间的匹配度比较,进而利用「蛋白质拼图」的逻辑实现蛋白质分子刚性对接 (rigid protein docking) 。实验表明,基于 HMR 的分子对接模型比当前深度学习 SOTA [1] 有更高的准确性,并且较传统分子对接方法提速 100 倍以上。相关论文已被收录于 ICLR 2023。
论文地址:https://openreview.net/pdf?id=ySCL-NG_I3 代码地址:https://github.com/GeomMolDesign/HMR
- 不同于常见的基于序列或者二维 / 三维图结构的建模方式,团队采用了基于表面的分子建模方法。这种建模思路既保留了分子整体的三维结构,又避免了对于大分子内部结构的冗余建模。在和蛋白质功能、蛋白质相互作用等表面相关的下游任务中可能更具优势。 - 采用黎曼流形直接对分子表面进行建模,并用分子形状基因和对应的本征函数来表示表面的函数分布。这种建模方法不受表面离散采样和三角剖分方法的影响,因而具有更好的鲁棒性。团队同时展示了基于调和分析和滤波概念的表面传播深度学习模块,以及基于泛函映射的表面对接方法。 - 文中利用这种表面建模方法和「拼图」的思想实现了基于深度学习模型的蛋白质刚性分子对接。相比于目前基于三维图神经网络的深度学习模型取得了更好的效果,在速度上相比于传统方法也有大幅提升。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章