牵手礼来和诺华,谷歌旗下AI公司原子级预测蛋白质三维结构
创新药研发过程中存在Eroom’s Law(反摩尔定律)。
据Nature Reviews Drug Discovery数据,自1950年以来,每10亿美元研发费用对应的美国FDA批准的新药数量大约每隔9年就会下降一半。造成这一趋势的关键原因之一是对现有疗法改进的门槛变高,而AI作为一种数字工具,具有降低技术门槛,提高新药研发效率的潜力。
因此,近年来AI与生物制药企业的“跨界”合作不断增多。如2024年1月7日,数字生物公司Isomorphic Labs(以下简称“Iso”)宣布与礼来公司(Eli Lilly and Company)和诺华公司(Novartis)达成战略合作,这也是Iso首次建立制药合作关系。两项合作均聚焦于小分子药物的研发,或为Iso带来近30亿美元的预付款和业绩里程碑资金。
Iso成立于2021年11月,总部位于伦敦,在瑞士洛桑设有第二家分部。它在谷歌的母公司Alphabet内部独立运营,现由Alphabet旗下的DeepMind接管。不同于一般的初创公司,Iso在资金和计算能力方面拥有超凡实力。
AlphaGo的创造者,创始人横跨游戏、神经和AI三大领域
Iso无疑站在了AI与生物学科交叉的“十字路口”,但要将超凡实力归功个人,就不得不提到Iso的创始人——人工智能先驱Demis Hassabis。
Demis Hassabis(图源:Iso官网)
2016年3月,AlphaGo打败了顶级围棋手李世石,让全世界都为之震撼。但背后创造者的姓名却鲜为人知,其实他便是拥有丰富人生经历,具有游戏开发者、神经学家和人工智能企业家三重身份的Demis Hassabis。
Hassabis从4岁开始下象棋,是国际象棋界的天才儿童。17岁,他就编写了销量达数百万的模拟游戏《主题公园》。以第一名的优异成绩从剑桥大学计算机科学专业毕业后,他成立了电子游戏公司Elixir Studios,为Vivendi Universal等全球发行商制作获奖游戏。而在商界“摸爬滚打”十年后,他又重返学术界,在伦敦大学洛杉矶分校完成了认知神经科学博士学业,随后又在麻省理工学院和哈佛大学从事博士后研究,最后创立了DeepMind。
2013年12月,DeepMind成立仅4年,团队成员不足20人,还没有具体产品问世。它却仅凭在机器学习研究大会上演示的一款软件(展现出了从零开始学习并能掌握复杂任务的能力),就吸引谷歌以4亿英镑(约6.6亿美元)将其收购,这也是这是谷歌迄今为止在欧洲进行的最大一笔收购。
被收购后,DeepMind仍在很大程度上被赋予自主权,现已成为Alphabet的一部分,并不断取得里程碑式的突破。Iso正是从DeepMind拆分而来,以AlphaFold在蛋白质折叠方面的开创性工作为基础,在DeepMind成功预测蛋白结构的研究基础上发展。
基于同构逻辑,通过AI预测分子和疾病的全貌
公司名称“Isomorphic”,译为同构。同构即抓取事物最本质的信息,忽略其他非必要因素,把具有相同底层结构的对象视为一体。也就是说,同构意味着生物系统和信息科学原则上共享共同的底层结构。AI不仅可以用于分析数据,也可以通过深度学习、强化学习、主动学习和表征学习等方式熟悉生物学规则,建立复杂生物现象的预测和生成模型。
药物中分子间的相互作用具有复杂性,发生在肉眼看不见的微观世界,难以使用传统的数学和物理方法来预测和生成。而这正是机器学习和人工智能的优势所在,它们通过从数据中学习,可以持续优化预测和生成系统的模型,直至达到完美的演绎。
但要想超越统计推论的简单模型,并非易事。Iso通过深度训练和模型迭代,创建了数字版本的生物系统。其具有可控性与可塑性,提供了一个可验证性的平台,可以预测和模拟这些模型所代表的生物分子空间。平台通过判断药物发挥作用的路径,设计出新型治疗药物。就像DeepMind的算法AlphaGo能够智能地搜索“围棋”空间以找到下一步棋一样,Iso开发的算法AlphaFold能够搜索“分子”空间以探索生物分子和疾病的全貌。
新一代AlphaFold几乎覆盖全PDB,超140万人访问数据库
与前代AlphaFold相比,新一代AlphaFold与Iso开发的其他突破性人工智能模型的深度整合,更能够“摸清”药物靶点的潜在生物机制,精准预测蛋白质的结构。
其优势及应用场景如下:
■ 原子级的预测精度
“结构即功能”,蛋白质的功能取决于其三维结构,但要高精度地预测这些结构类型并不容易。X射线照射结晶的蛋白质可以将其产生的衍射光转化为蛋白质的三维原子坐标,从而获得准确的蛋白质结构,但时间和金钱成本极高。随后,计算机凭借强大的算力开始被应用于模拟蛋白质结构,但精确度不高,理论的预测方法与实验结果相差甚远。
John Moult等生物学家创立了CASP(蛋白质结构预测大赛),来衡量预测蛋白质结构的结果准确性。测试的主要指标是GDT(氨基酸残基在阈值范围内与正确位置的百分比),如果GDT能达到90分以上就可以被认为与实验方法无异。
在2020年11月公布的最新一届CASP评估结果中,AlphaFold系统总分为92.4GDT,这意味着预测平均误差约为1.6埃(一埃等于0.1纳米),相当于一个原子的宽度。即便是对于最难的随机蛋白质结构预测,AlphaFold也拿到87.0GDT的高分。据Iso官网表示,新迭代的AlphaFold模型将预测准确性再次显著提高,其预测精度可以达到原子级。
■ 覆盖范围不断扩大
AlphaFold在单链蛋白质预测方面取得了根本性突破;AlphaFold-Multimer将适用范围扩展到包含多条蛋白质链的复合物;随后是AlphaFold2.3,它提高了性能并将覆盖范围扩大到更大的复合物;新一代的AlphaFold将覆盖范围从蛋白质扩展到包括配体(小分子)、核酸(DNA和RNA)以及含有翻译后修饰(PTM)的分子等蛋白质数据库(PDB)中的几乎所有生物分子。
对蛋白质配体复合物(a)、蛋白质(b)、核酸(c)和共价修饰(d)结构的预测性能
(图源:Iso官网)
2022年,AlphaFold与EMBL的欧洲生物信息学研究所(EMBL-EBI)合作,通过AlphaFold蛋白结构数据库免费提供AlphaFold对科学界已知的几乎所有编目蛋白质的结构预测。
■ 完善基础生物学
此外,AlphaFold可以完成蛋白质和配体结构以及核酸和含有翻译后修饰的核酸的建模,为研究基础生物学提供了更快速和准确的工具。
如AlphaFold预测了CRISPR系统中crRNA和DNA结合的CasLambda的结构。CasLambda具有CRISPR-Cas9系统的基因组编辑能力,俗称"基因剪刀",研究人员可以用它来改变动物、植物和微生物的DNA。而且体积更小,可以更有效地用于基因组编辑。
crRNA和DNA结合的预测结构
(图源:Iso官网)
■ 准确预测蛋白质配体结构
新一代AlphaFold在与药物研发相关的蛋白质结构相关部分的能力明显超越了AlphaFold2.3和行业标准,尤其是在抗体结合预测方面。目前,主要使用"对接方法"来预测蛋白质配体结构,需要参考蛋白质结构或配体口袋的位置。
而AlphaFold的最新模型无需蛋白质结构或配体口袋位置的先验信息,就能预测以前未进行结构表征的全新蛋白质。它还可以对所有原子的位置进行联合建模,能够更全面地揭示蛋白质和核酸与其他分子相互作用时的灵活性。
另外,在最新发布的治疗案例中,AlphaFold最新模型的预测结构(彩色显示)与实验测定的结构(灰色显示)非常接近,其中包括抗癌分子的结合(PORCN)、关键癌症靶标的共价配体结合(KRAS),以及脂质激酶变构抑制剂(PI5P4Kγ)的结构预测。
对PORCN(1)、KRAS(2)和PI5P4Kγ(3)的预测图(图源:Iso官网)
Iso正在将迭代的AlphaFold模型应用于治疗药物设计,使快速准确地预测和生成对治疗疾病有效的多种关键大分子结构成为可能。据Iso官网表示,迄今为止,已有190多个国家的140万用户访问了AlphaFold数据库,全世界的生物学家利用AlphaFold的预测结果,推动了从加速新型疟疾疫苗的研发、促进癌症药物的发现到开发塑料吞噬酶以解决污染问题等各个方面的研究进展。
提升新药研发效率,AI药物市场规模将达59.4亿美元
准确预测蛋白质配体结构可以识别和设计新的生物分子,进而推动药物研发进程。根据《2020年中国新药研发行业分析报告》的数据显示,I期临床药物最终获批概率仅有11.30%,即使进入III期临床成功率也只有53.40%,临床阶段整体费用占比高达70%。新药研发普遍存在周期较长和回报率较低的问题,而AI不失为一种提升新药研发效率的有效工具。
AlphaFold对生物复杂系统的强大建模能力更是证明,“数字生物学”制药时代即将到来。人工智能的拓展性功能为生物医学突破带来希望,并有望在基因组学、生物可再生材料、植物免疫、潜在治疗靶点、药物设计机制以及蛋白质工程和合成生物学等领域“大放异彩”。
据Research And Markets的数据,全球人工智能药物研发的市场规模将从2020年的9.1亿美元增长到2021年的12.7美元,复合年增长率(CAGR)为39%。到2025年,市场规模预计将达到59.4亿美元,复合年增长率可达47%,AI制药行业“冲劲十足”。
提供AI技术属于AI制药行业的产业链的上游产业,此外还包括中游和下游产业。随着资本入场AI制药赛道,除传统药企和Biotech公司外,包括药明康德、IQVIA在内的CXO企业也纷纷加入进来,投身AI技术赋能药物的研发之中。
放眼海外,市值达数十亿美元的上市企业均跻身于AI制药行业,如14条药物管线均进入临床阶段的Roivant sciences、两条药物管线进入临床阶段的Structure Therapeutics和Schrödinger等。相较于海外,国内AI制药行业起步较晚。但自2015年起,晶泰科技、亿药科技、星药科技、望石智慧、燧坤智能等诸多AI制药初创企业涌现。同时,药明康德等传统药企通过战略合作或股权融资等方式切入AI制药赛道,百度、腾讯和阿里巴巴等互联网大厂也纷纷布局此领域。
* 参考文献:
〔1〕Jumper, J. et al. Highly accurate protein structure prediction with AlphaFold. Nature 596, 583–589 (2021).
微信扫码关注该文公众号作者