AI对于生物学,早就不只是AlphaFold了……
2022年,Nature Medicine发布了题为“AI in health and medicine”的综述文章,表明人工智能正在重塑医学。
不久,DeepMind官宣:AlphaFold2预测出2.14亿个蛋白质结构,几乎涵盖地球上所有已知蛋白质。
近一年来,我们见证了AI在生物医学中的一次次突破。
本文根据蛋白质结构、算法模型、临床数据三大热门领域,对近一年以来的43篇重要论文进行整理,并且选了13篇具有代表性的文章为大家叙述,与各位共同回顾AI为生物医药带来的改变。
并且今天免费为大家送一波福利!
扫描二维码,回复【生物】
领取43篇经典AI+生物应用论文合集
全是pdf格式,非常方便,想要的同学千万不要错过!
一、 蛋白质相关研究论文
01
通过AlphaFold辅助蛋白质设计开发了一种蛋白质递送系统
推荐理由:2023年3月29日,CRISPR基因编辑先驱张锋教授及其团队在Natrue期刊发表该研究论文。在这项最新研究中,张锋团队通过AlphaFold辅助蛋白质设计开发了一种蛋白质递送系统—— 改造、利用独特的细菌“注射器”将蛋白质注射到人类细胞中。这种新型蛋白质递送方式或将改变基因治疗、癌症治疗等前沿疗法格局,具有强大的应用前景。
02
清华大学和MIT团队:使用AlphaFold方法增强COVID-19抗体
推荐理由:在PNAS杂志上,清华大学与麻省理工学院联合发表论文。科学家描述了修改一种已知的针对 COVID-19 的抗体,以提高其针对多种疾病变体的功效。团队参考了AlphaFold 2,并且采用了其方法,但没有使用DeepMind的代码。
03
华为:推出全流程蛋白质结构预测工具 MEGA-Protein
推荐理由:华为与北京昌平实验室、北京大学生物医学前沿创新中心团队、深圳湾实验室高毅勤教授课题组,联合推出全流程蛋白质结构预测工具 MEGA-Protein。
图:不同方案预测的蛋白质结构效果对比
包含 AI MSA 引擎、蛋白质折叠训练推理流程、蛋白质结构打分、蛋白质结构预测数据集 PSP 等关键技术。
04
Nat Commun|提升AlphaFold2蛋白-蛋白相互作用的预测能力
推荐理由:以AlphaFold2为基础,Patrick Bryant等人提升了蛋白复合物预测的能力,该工作发表在Nature Communication上。作者优化了复合物结构预测中的MSA输入,大幅提升了AF2的复合物结构预测能力,并且发展的pDockQ指标可以很好地分类蛋白是否能相互作用。
05
David Baker团队:仅根据靶点结构设计蛋白质的结合蛋白
推荐理由:华盛顿大学蛋白设计研究所的David Baker、曹龙兴和Brian Coventry等人在Nature发表文章,介绍了一种仅根据靶点蛋白的结构信息就可以进行蛋白质从头设计的方法,该方法可以对治疗和诊断中各种蛋白质上的位点进行针对性的设计,具有广泛的用途。
因篇幅有限,仅展示蛋白质相关论文前5篇
领取43篇经典AI+生物应用论文合集
全是pdf格式,非常方便,想要的同学千万不要错过!
二、药物设计算法相关论文
关键词:深度学习、算法模型、药物设计、产学进展
01
百度:利用几何构象提升化合物分子建模效果
图:GEM的整体框架
推荐理由:百度在《Nature Machine Intelligence》上发表了AI+生物计算的研究成果,提出“基于空间结构的化合物表征学习方法”,即“几何构象增强AI算法”(GEM模型),揭示了一种基于三维空间结构信息的化合物建模方法,以及在药物研发中的应用。
02
MIT:用深度学习模型发掘潜在药物分子,速度提升1000倍
推荐理由:麻省理工学院的研究团队用 EquiBind 挑战了药物分子预测问题。这是一种 SE(3) 等变几何深度学习模型,对受体结合位置(盲对接)和配体的结合姿势和方向进行直接预测。与传统和最近的基线相比,EquiBind 实现了显著的加速和更好的质量。论文已在第 39 届机器学习国际会议(ICML 2022)上发表。
03
Stanford | 基于蛋白-配体复合物的几何深度学习,指导基于片段的配体生成
推荐理由:斯坦福大学计算机科学系Ron O. Dror教授组针对配体生成问题,使用数据有效的E(3)等变网络和3D原子点云表征进行建模。该方法能结合蛋白质口袋的3D空间信息同时生成合理的分子,从而加速药物发现过程。通过对多种性质进行评估证明该框架确实能生成可行的分子。
因篇幅有限,仅展示药物设计算法相关论文前3篇
领取43篇经典AI+生物应用论文合集
全是pdf格式,非常方便,想要的同学千万不要错过!
三、临床数据相关论文
关键词:知识图谱、组学数据、数据库挖掘/验证
01
Nat. Biotechnol. | CKG : 用于解释临床蛋白质组学数据的知识图谱
推荐理由:CKG建立在科学的Python库上,包括analytic score、graphdb builder、graphdb connector等四个独立的功能模块。它可以在标准工作流程和基于Jupyter笔记本的互动探索中实现可重复、可再现和透明的分析。整个系统是开源的,并取得了MIT许可,有关介绍已发表在Nature上。
02
MIT团队:从科学文献中自动提取化学反应
推荐理由:麻省理工学院计算机科学与人工智能实验室的Jiang Guo等人在J Chem Inf Model杂志发表文章,介绍了一种从化学文献中提取反应的自动化方法。将其表述为结构预测问题,并通过一个由产物提取和反应角色标记组成的两个阶段的深度学习架构来解决。
03
Science | ChemPU中化学合成文献数据库的数字化和验证
推荐理由:2022年7月7日,Science发表了一篇关于化学合成自动智能化的论文。Simon Rohrbach等研究人员提供了一个包含100个分子的自动可执行化学反应数据库,包括过渡金属催化的偶联反应、杂环形成、官能团相互转化和多组分反应。合成中,已下载数据库中的50多个条目,并在七个模块化 ChemPU 中自动运行,其产率和纯度与专业化学家所达到的相当。
04
Nat. Commun. | 生物科学领域应用深度学习的当前进展和公开挑战
推荐理由:莱斯大学(Rice University)的研究人员讨论了深度学习在蛋白质结构预测、蛋白质功能预测、基因组工程、系统生物学和数据集成以及系统发育推断,共五个广泛领域的最新进展、局限性和未来前景。综述发表在Nature Communications上。
05
ACM:未来,合成生物学与人工智能会对世界产生哪些影响?
推荐理由:劳伦斯伯克利国家实验室(LBNL)、美国空军研究实验室(AFRL)等机构的研究人员合作,对人工智能在合成生物学中的应用现状、影响、挑战以及潜力与前景进行了较为系统的阐述。以Artificial Intelligence for Synthetic Biology为题,发布在《Communications of the ACM》。
因篇幅有限,仅展示临床相关论文前5篇
领取43篇经典AI+生物应用论文合集
全是pdf格式,非常方便,想要的同学千万不要错过!
另外,我邀请了我的朋友——美国著名高校人工智能生物信息方向博士James,在28日晚20:00做一场关于ChatGPT下生物数据挖掘实践分享。
James老师,美国著名高校人工智能生物信息方向博士,海外大厂研究经历。主要研究方向为深度学习,AI生物信息,AI辅助药物设计,可解释机器学习,医学影像等。在多个国际顶级期刊如Nature Communications等一作发表多篇论文并担任CVPR, AAAI等会议期刊委员会成员、审稿人。
直播主题
01:AI+生物信息
02:生物信息学的大模型
生物信息学的大模型--Prottrans
生物信息学的大模型--ESM
目前困境
03:ChatGPT+生物信息
立即扫码预约28日晚20:00直播
《关于ChatGPT下生物数据挖掘实践》
微信扫码关注该文公众号作者