Redian新闻
>
最新发布的AlphaFold 3有多厉害?我们请使用者聊了聊

最新发布的AlphaFold 3有多厉害?我们请使用者聊了聊

健康

如果将生命体比作一个拼好的乐高积木,那蛋白核酸等大分子就像一个个独立的乐高零件。在过去的五十年里,理解每一个乐高零件的形状就是结构生物学家的主要工作。他们并非不关心零件是如何拼成整个积木的,只是并不具备这种能力——他们连零件长成什么样子都不甚清楚。


而AlphaFold让他们梦想成真。 


最新,谷歌Deepmind发布了重磅消息:他们的蛋白质分析AI工具AlphaFold全新升级,迎来了第三代版本。


和前代相比,AlphaFold 3的分析准确性又有了显著提升,而且在蛋白质本身以外,它还能够预测“几乎所有分子类型”的蛋白质复合物结构。新闻报道声称,这一工具将会在生物医药研究领域带来“戏剧性”的改变。


AlphaFold 3到底有多厉害?它能帮助人类尽快用上新药吗?我们与一位实际使用AI工具的结构生物学研究者聊了聊。


知道蛋白质结构为什么重要?


如果生命科学是一部书,那在书的扉页能看到一段费曼的寄语:一切生命世界的行为都可以被理解为原子的颤动和扭动。这意味着想要真正的理解蛋白质,就必须从三维空间深入到原子分辨率,这才是蛋白质发挥功能的尺度。结构生物学就是在这样一种理念下诞生的。


在AI参与之前,

蛋白质结构是怎么研究的?


获取蛋白质结构的主要方式分成实验测定和计算预测两个流派。


在AI入局之前,其实人们就已经在用计算机分析蛋白质了。但是,那时候预测准确率较低,结构的细节往往不被采信,但是这些预测结构有时会被当作晶体结构解析的模板使用。


真正确认蛋白质结构要靠实验测定,方法包括蛋白质晶体X射线衍射、冷冻电镜、核磁共振等等。通过实验获得高分辨率的蛋白质结构又慢又困难:在晶体时代,弄清一个晶体结构往往就会消耗一个博士生的整个求学生涯。


实验解析的结构会被上传到蛋白质数据库(https://www.rcsb.org/),过去五十年间,大约有二十万个结构被提交到这个数据库。这些既往数据是训练AlphaFold时重要的学习材料,可以说AlphaFold的诞生是对几代结构生物学家辛勤工作的一种报偿。


AlphaFold诞生,

让研究发生了多大改变?


蛋白质结构预测的里程碑式事件是在2020年的CASP14上,AlphaFold2预测蛋白质的分辨率达到了近原子级别。更重要的是,这些结构在细节上是“对”的——也就是说,在药物筛选等研究场合,AI的预测结果变得很有用。


在速度上,AlphaFold2也远远甩开了实验手段:消耗一个博士生几个月甚至几年的时间才能得到的结构,一张GPU花半个小时就可以得到一个近似的,这在之前是无法想象的。


正是依靠这样的效率,AlphaFold在很短的时间内就预测了六七亿个蛋白质结构。而在这之前,经过几代结构生学家的努力,人类在半个世纪内仅仅只累积了二十万个蛋白质的结构。


从1代到3代,AlphaFold改进了什么?


和过去的预测模型相比,1代AlphaFold的出现就好比从“流水线”变到了“一体成型”。


以往的结构预测方法是同源建模,它更像一个流水线,由很多个模块构成。模块A处理完交给B,B处理完交给C,这导致每个步骤产生的误差会相互累积放大,导致最终的模型偏差比较大。


而AlphaFold是一个神经网络方法,它是‘端到端’的,原来的流水线换成了一体成型的工艺,误差累积的问题被完美解决。初始的AlphaFold是一个很简单的模型,但在当时它的表现已经十分领先。


此后的AlphaFold 2更是一个划时代的工程——它做到了史无前例的准确。AlphaFold采用了经典的卷积神经网络架构,而Alphafold2则将能力更强的Transformer架构引入进来。有了更深更强网络的加持,AlphaFold2使人类第一次可以预测原子级分辨率的蛋白质结构。


而AlphaFold3的进步则在于它不止可以处理蛋白质,还可以同时输入核酸、小分子、金属离子等物质,并预测它们会如何与蛋白质结合。拥有这种能力对于结构预测是极其重要的,因为蛋白质不可能孤立地发挥作用,它一定要与其他物质产生交流。而这个与其他物质交流的过程,往往是科学家最关心的,也是药物设计中最重要的过程。


对于使用者它的研究者,

这意味着什么?


AlphaFold让我们的研究发生了以下改变:


提高效率


对于结构生物学的研究者来说,在AlphaFold出现之前,大量的精力是用来进行模型搭建的。尤其在晶体时代,由于方法本身的限制,并不是所有的衍射数据都能获得蛋白质结构,往往需要一个相对正确的模板。可以说AlphaFold完全解决了这个问题,自从它诞生以来,由于缺少模板无法求解的晶体结构变得凤毛麟角。并且它将科研工作者从繁重的模型搭建工作里解放出来,甚至从源头减少了模型搭建错误的产生。


工作流程简化


对与结构生物学家和药物设计工程师来说,工作的起点往往是一个高分辨率的结构。在过去,他们耗费很大的精力和努力去获得结构,然后进行实验的设计和验证。


但是现在,这个最耗时的过程可以省略或者先绕过,通过预测得到的蛋白质结构进行实验的设计、机理的阐释、药物的开发。Alphfold的出现已经从根本上改变了和简化了工作的流程。


窥探“终极秘密”


如果将生命体比作一个拼好的乐高积木,那蛋白核酸等大分子就像一个个独立的乐高零件。在过去的五十年里,理解每一个乐高零件的形状就是结构生物学家的主要工作。他们并非不关心零件是如何拼成整个积木的,只是并不具备这种能力——如果连零件长成什么样子都不清楚就想知道整个积木的形状,那是天方夜谭。在很长的时间里,理解清楚每个零件的形状是结构生物学家的梦想。


AlphaFold让梦想成真。如今的AlphaFold不止告诉我们每个零件的形状,他也开始告诉我们零件和零件之间是怎样拼接的。他给研究者提供了一种可能性:也许今天我们可以窥探从零件到整个积木的秘密了。


这些技术有什么厉害的应用进展吗?

我们普通人也能感受到吗?


AI参与药物设计的案例和进展已经有了不少,它在药物研发早期的表现也很亮眼。


但是,药物研发是一个很漫长的过程,AI参与的蛋白质研究和药物分子筛选只是其中最初的步骤。这些研究成果后续还需要大量时间进行临床研究验证,然后才能进行应用。所以我们大概还要过些年才能用上AI参与开发的药物。


不过,更有可能让人体会到变化的也许是蛋白质工程领域。随着技术的进步,AI引导的合成生物学可能会彻底改变人们的生活。


AlphaFold3好用吗,

使用起来是什么感觉?


实际试用后,有如下几点感受:


UI设计更人性化



AlphaFold2提供了开源版和colab版本,没有经过封装,可视化效果比较简陋。但是AlphaFold3提供了网页版的AlphaFold server,对于不熟悉代码的使用者非常友好。


AlphaFold2 Colab version

AlphaFold3 server


小分子-蛋白复合物预测精准


一直以来,小分子-蛋白质复合物预测是一个重要但艰巨的任务。从目前跑完的几个案例来看,AlphaFold3在这项任务上的完成度很好,与实验结果非常接近,令人惊喜。


但是,目前的测试版本并没有开放所有的小分子输入,其他没有列出的分子表现如何还需要进一步测试来验证。


实验结构(蓝色)与预测结构(绿色橙色)的对比


抗体-蛋白复合物预测准确度有所提高


抗体-蛋白复合物预测是另一类难度很大但是非常有意义的任务,因为这项任务直接指向了生物大分子药物的开发。相比较alphfold2新版本在这项任务上结合模式向着准确迈进,但是细节上仍有很大的差异。这方面未来仍需要更多改进。


蛋白质-DNA复合物预测精准


从测试结果来看,AlphaFold3在这方面的表现相当精准。如果非常乐观的话,可以认为AlphaFold3已经解决这个问题了,以后DNA结合蛋白的研究方式和逻辑可能会发生根本性的变化。


蓝色预测 vs绿色实验


可以肯定的是上图的任务并未出现在它的训练集里。


速度变快


不可思议的是相比较AlphaFold2,AlphaFold3的运行速度提高非常明显。这可能是因为模型的构架更加合理,或者谷歌提供了更多的算力支持。


不过,目前的AlphaFold3还只是并不能自由使用的beta版本,它究竟能对研究产生多大影响,还要看后续的更新与开源情况才能确定。


作者:腺嘌呤核苷三磷酸

编辑:窗敲雨

封面图来源:deepmind



本文来自果壳,未经授权不得转载.

如有需要请联系[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
医药ChatGPT时刻!这几家公司会被Alpha fold3颠覆吗?手推车及我乌克兰的和平我们跟一线 AI 开发者聊了聊,发现中国开源生态已经在全球找到了自己的位置AlphaFold3、印度大选,以及成年人的玩具心头好|每周播报AI预测所有生命分子!谷歌AlphaFold 3模型登Nature,免费开放节省上亿年研究时间视频号挂载短剧是“鸡肋”?我们和多位从业者聊了聊针对1亿多只宠物的动物疫苗蓝海,我们与艾益动物药品创始人聊了聊 |【经纬低调推公司】一个人有多强,就有多弱谷歌搅局AI制药,进击的Alpha Fold3模型填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来AlphaFold 3轻松应对核酸、脂类分子?科学家迫不及待地更新了评测所有生命分子一夜皆可AI预测!AlphaFold 3改变人类对生命的理解,全球科学家都能免费使用北京车展前瞻|哪些车型值得关注,我们找投资人和经销商聊了聊顺应环境看到邻居23岁就年薪百万的小儿子,我才知道“瓦拉赫效应”到底有多厉害准确率比现有方法高50%!谷歌DeepMind全新深度学习模型AlphaFold 3重磅论文登上《自然》生命科学工具散点爆发中,除了技术还有哪些关键因素?我们与英赛斯创始人聊了聊 |【经纬低调推公司】AlphaFold 3一夜预测地球所有生物分子,谷歌DeepMind颠覆生物学登Nature头版!Nature:AlphaFold 3发布!正在突破越颜宁质疑、改写新药研发!求求你们了!请使用 Linux 做开发!与AlphaFold3持平!国产抗体设计生成式AI大模型发布,能同时预测抗原抗体复合物结构和抗体从头设计关于“只能住院15天”的真与假,我们和四位医生聊了聊AI接近成为神?谷歌AlphaFold 3直接预测生命过程我们试驾了最新的 Model 3 高性能版,还和特斯拉设计师聊了聊清明,我去初恋的墓前喝了杯酒 | 我们和10个逝去的人聊了聊如何活着AlphaFold3来了,模拟、预测生命的能力更强了AlphaFold 3不开源,统一生物语言大模型阿里云先开了!AlphaFold 3引不满!服务器被黑,全世界科学家竞相破解被爆硕士学历造假,港大经管学院展开调查;科学家联名质疑AlphaFold 3的公开性,《自然》回应 | 环球科学要闻中国二十四节气里隐藏的健康智慧,到底有多厉害?美股基本面 - 2024_03_11 * 晚报 * 收盘:美股涨跌不一 标普500指数连续第二日下滑。白宫预计今年美国经济增长AlphaFold的伟大,只因做对了这5件事!DeepMind副总裁:团队注定会取得突破AlphaFold3 要帮人类解析生命,做得怎么样?美国空军到底有多厉害?排名前十的国家飞机加起来都没有美国多…
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。