Redian新闻
>
妙啊!用扩散模型生成蛋白质结构,结果不输天然蛋白质|来自斯坦福&微软

妙啊!用扩散模型生成蛋白质结构,结果不输天然蛋白质|来自斯坦福&微软

公众号新闻
丰色 发自 凹非寺
量子位 | 公众号 QbitAI

没想到,图像生成领域的大明星——

扩散模型,这么快就被用来做蛋白质结构生成了!

而且结果在复杂度和结构上都和天然蛋白质有的一拼。

消息一出,不少人都称赞这个组合简直非常妙。

还有人表示:我早就猜到了,生成模型能做的真的不仅是图像和视频。

所以,AlphaFold这是可能有新的挑战者了?

具体是怎么回事?

来看看斯坦福大学和微软的这项最新研究成果到底怎么说。

扩散模型vs蛋白质结构生成

说起研究的初衷,作者表示:

尽管蛋白质结构预测已经取得了非常好的成绩,但要从神经网络中直接生成多结构多样又新颖的蛋白质结构仍然很困难。

他们想到用基于扩散的生成模型来挑战这一任务,并通过镜像蛋白质自然折叠过程来设计蛋白质主链结构。

具体来说,就是将蛋白质主链结构看成一系列连续的角度,这些角度会捕捉组成氨基酸残基的相对方向。

进而通过从随机、未折叠状态到稳定折叠结构的去噪就可以生成新结构。

作者表示,这一设计不仅可以反映蛋白质如何在生物学上扭曲成能量上有利的结构(how proteins biologically twist into energetically favorable conformations),这种表示的固有位移和旋转不变性也可以极大地减轻模型对复杂等变网络的需要。

在实现上,作者仅用一个简单的transformer作为backbone就训练出了一个去噪扩散概率模型。

最终证明它可以无条件地生成高度真实的蛋白质结构,其复杂性和结构模式类似于天然蛋白质的结构模式。

如下图Ramachandran plot(拉氏图,专门用于检测蛋白质构象是否合理)所示,左右分别为测试集和生成的蛋白质主干的(φ,ψ)二面角。

可以看到,三个主要结构元素、以及一些不太常见的角度组合都在他们用扩散模型生成的主干中得到了呈现。

目前,基于以上成果,作者已公开发布了首个用于蛋白质结构扩散的开源代码库和训练模型,详情可戳文末链接。

不过,作为一个初步探索,他们也指明这项成果还存在几个局限性,比如:

1、与通常有几百个残基的天然蛋白质相比,模型生成的结构仍然相对较短(最多128个残基)

2、由于没有处理多链复合物或配体相互作用,模型无法捕获蛋白质的动态性质,只能生成静态结构;

3、将蛋白质表述为一系列角度的框架设计会造成一些累积误差,最终显著改变生成的整体结构。

最后一个问题则可以对未来工作提供思路,比如试着用几何信息架构中使用的方法来解决相关问题。

最后,除了再次刷新我们对扩散模型的认知,一位毕业于ETH的研究人员看完这项成果后还大胆预测道:

未来5年内,可能渐渐没有人会对全新的蛋白质序列或折叠感到兴奋了。

因为潜在的新酶和治疗性抗体将通过文本提示生成

对于这项成果,你有什么想说的?

论文地址:
https://arxiv.org/abs/2209.15611

代码:
https://github.com/microsoft/foldingdiff

「2022人工智能年度评选」火热报名中

现在,量子位「2022人工智能年度评选」已经正式启幕,评选将从企业、人物、产品/解决方案三大维度设置5类奖项。

更多关于评选标准、榜单报名欢迎扫描下方二维码~


点这里关注我 👇 记得标星噢 ~


一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~  



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
卷!MIT泊松流生成模型击败扩散模型,兼顾质量与速度GAN、扩散模型应有尽有,CMU出品的生成模型专属搜索引擎Modelverse来了7 Papers & Radios | 扩散模型只用文字PS照片;MIT泊松流生成模型击败扩散模型卷!用扩散模型合成连贯视觉故事,输入字幕就能脑补画面,代词ta都分得清生成扩散模型漫谈:统一扩散模型(理论篇)世界首个!Meta AI开放6亿+宏基因组蛋白质结构图谱,150亿语言模型用两周完成【庭院种菜】你在菜地用人尿做肥料吗?遙想生命裏的那些蓬勃的日子卷!MIT提出泊松流生成模型击败扩散模型,兼顾质量与速度佐藤大Nendo新作!用汉字“手”为知名品牌打造LOGO,妙啊!Soft Diffusion:谷歌新框架从通用扩散过程中正确调度、学习和采样新发现TraderJoe好物,可做美味家常菜龙卷风健康快递 199AlphaFold终结了生物学家研究蛋白质结构之路 于是颜宁回国了!7 Papers & Radios | 谷歌推出DreamBooth扩散模型;张益唐零点猜想论文出炉Meta打造首个「蛋白质宇宙」全景图!用150亿参数语言模型,预测了6亿+蛋白质结构生成扩散模型漫谈:一般框架之SDE篇扩散模型再下一城!AR-LDM:用扩散模型合成连贯视觉故事!输入字幕就能脑补画面,代词ta都分得清斯坦福/谷歌大脑:两次蒸馏,引导扩散模型采样提速256倍!生成扩散模型漫谈:最优扩散方差估计(下)Struct2Graph:基于结构的蛋白质-蛋白质相互作用预测的图注意网络斯坦福、微软联手,用扩散模型进行蛋白质结构生成,已开源小哥冒充斯坦福学生,混入学校生活一年... 交斯坦福女友,连父母都信了....扩散模型在文本生成领域的应用基于基因组RNA二级结构,斯坦福大学开发一种全新靶点超高效抗病毒药采样提速256倍,蒸馏扩散模型生成图像质量媲美教师模型,只需4步意淫的天花板 -- 虽远必诛!从多篇论文看扩散模型在文本生成领域的应用​生成扩散模型漫谈:条件控制生成结果生成扩散模型漫谈:最优扩散方差估计(上)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。