关注的焦点之一在于,有人认为AlphaFold公布了超过350000种蛋白质结构预测模型,覆盖几乎整个人类蛋白质组,并表示AI已经砸了结构生物学家的饭碗。虽然科学家与AI各有所长,两者并非取代关系,但这也从侧面体现了AI在蛋白质结构预测方面的强大能力——它运算速度快、不需要休息,曾被人诟病的预测准确度也越来越高。而这种能力被科学家移花接木到制药行业,可用于发现全新的药物研发过程,比如全球款获批的新冠特效药Paxlovid,便依靠晶泰科技的预测算法,仅用六周就确认了该候选药物的优势晶型。
而AI制药,也日益为人关注。
近期,我们请到了中科计算技术西部研究院客座教授;图灵·达尔文实验室副主任赵宇,一起来聊聊「AI制药」的技术路线、瓶颈与突破点。
AI为制药,并非条条通罗马
据上海国际生物医药产业周发布的《2022AI制药行业观察报告》统计,从2014年至2018年,全球AI制药领域的投资额增长了15倍。国外AI制药的先行者如Exscientia、Recursion等,均在此期间成立并发展壮大。仅2021年,国内便有20余家AI制药公司获得融资,融资额近百亿元。麦肯锡的报告也显示,全球融资额前20的AI制药公司中,有29%的资金都来自中国。中国的创企和资本,都是AI制药领域的重要力量。
那么,为什么我们需要AI制药呢?
一方面,生物医药行业素有新靶点缺乏验证,而热门靶点研发扎堆的情况,这导致药企做了大量重复工作。
另一方面,新药研发的周期慢、失败率高,药物发现和药物临床阶段又要投入大量资金。
而AI制药公司,便是用人工智能来优化新药研发的流程。
利用强大的算力和算法,AI制药公司能大大缩短药物发现的周期,减低药物发现阶段的时间和人力成本。
另外,AI还能通过机器自主学习,发现专家经验以外的规律,优化药物研发流程。
《2022AI制药行业观察报告》数据显示,AI能将药物发现、临床前研究的时间将缩短接近40%,节约临床试验阶段约50%~60%的时间。
根据研发思路不同,AI制药存在两条不同的技术路线。
一条是以英矽智能、晶泰科技等为代表的“AI+分子”技术路线。
这类公司会利用自研的算法去发现新的分子,并且将大量有关靶点、疾病、临床试验和实验室数据投喂给算法,以预测新分子的物理化学参数、结合分数、与药物相似的特征等属性,挑选出据有成药潜力的分子,带入临床。以「英飞智药」为例,该公司自研了一个基于物理模型+数据驱动的AI药物分子设计平台——智药大脑(PharmaMind)。该平台能够利用AI挑选出有价值和容易成药的靶点进行开发,并利用知识图谱、分子评估等技术,融合人工智能和计算机辅助药物设计的多种模型,对化合物的多维度性质进行评价,包括理化性质、成药性、可合成性,对接打分和药效团匹配打分等等。据「英飞智药」的数据,该平台的设计成功率大于20%。
另一条则是以Insitro、「哲源科技」等为代表的“AI+疾病”技术路线。
这类公司将药物的研发流程反了过来,先在微观的层面找到基因和疾病的关联,再去寻找控制基因表达、抑制疾病发作的药物。
“AI+疾病”的制药公司Insitro,在2019年与吉利德达成战略合作,共同研发治疗非酒精性脂肪性肝炎(NASH)的创新疗法。该公司的思路简单来说是挑选出不正常的肝脏细胞,挨个敲除基因,观察哪个或哪几个基因敲除后,能改善肝脏细胞的疾病表现,甚至使细胞恢复正常。从技术的角度上讲,这虽然能够走通,但却是一个非常奢侈的方案。人类23对染色体中共有2万~3万个基因,这些基因和基因组合的数量庞大,需要消耗大量算力执行筛选。2021年Insitro获得了4亿美元C轮融资,但这也远不足以维持该方案的庞大开支。而「哲源科技」的思路与Insitro略有不同,其做法是搭建一个虚拟细胞行为算法流程,去分析、解释变异的基因如何驱动细胞的生理活动,这些活动带来什么影响,“这些变异基因改变细胞生理活动的走向、强度都能在这个流程里评估出来”。「哲源科技」把这套流程称作“基因组霰弹枪损伤评估流程”。人类在“出厂”前,就好像被上帝拿了把霰弹枪对每个人都开了一枪,造成了随机的损伤,也就是基因突变。而「哲源科技」的工作,就是用算法搞清楚这些变异造成了什么全局性的生物学事件的变化。团队没有直接将基因变异与疾病建模关联,而是先研发了算法,将基因层降维到细胞功能事件的数字化模型,再去与疾病、药物关联,来提升从数据中发现新洞见的可能性。量子位《AI制药深度产业报告》显示,2022年,国内AI制药市场规模为27亿元人民币,到2035年,这个数字将增长到2040亿元,年复合增长率高达39.47%。但想要开拓如此庞大的市场,AI制药行业面前还有不少问题亟待解决。洞悉疾病,AI制药如何实现“三级跳”
法国制药公司施维雅(Servier)2021年在药学领域顶刊Drug Discovery Today的文章指出:AI制药的意义在于,提高人们对疾病异质性的理解、识别失调的分子途径和治疗靶点、设计和优化候选药物,以及评估生物信息相关的临床疗效。礼来研究院发表过的一篇论文统计显示,一款新药的研发成本需要8.7亿美元,在临床前的研发成本占整体药物研发成本的30%左右。真正耗时、烧钱,成功率又低的环节是临床试验的三个阶段,而这是“AI+分子”制药公司难以触及的。行业媒体医药魔方文章也提到,当下中国创新药行业的根本动机发生了偏差——本质应该是疾病导向的药物研发,多年来在中国被异化成为了分子导向。无论是否有AI的加持,创新药的研发的初心都是亘久不变的,那就是关注患者和医生的诉求——治疗疾病。以“AI+疾病”驱动的制药公司,技术路线设计的出发点正是为疾病建模,为患者建立特异性模型。在诸多技术中,我们认为基因组学、数字孪生和临床试验,是在疾病导向视角下,最有可能解决当下AI制药行业瓶颈、帮助AI制药公司实现商业化的三个技术,它们就像三级跳,其中最基础的便是基因组学。像肿瘤这样的复杂系统,拥有了从基因层面到临床层面的大数据,不等于掌控了肿瘤进化、耐药机制。拥有了海量的知识文献,不等于能够发现治疗疾病的新靶点、新的药物起效机制(MOA)。疾病导向的药物开发有三个重要环节:疾病机制研究、患者特征研究和药物机理研究。比如Insitro的方法就是利用强大的算力和AI的学习能力,从人类基因组学数据中找到治疗疾病的靶点。但缺陷在于对于疾病异质性的机制理解程度不够,每发现一个疾病的靶点,都需要一个新的十万人以上级别的大队列。而之前提到的“基因组霰弹枪损伤评估流程”,则可以将人类的胚系基因组和肿瘤基因组信息映射到上千种通路和细胞行为等功能层面,根据不同细胞功能组合发现并模拟肿瘤疾病的发生发展的关键机制。例如识别肿瘤不同克隆特征,预测肿瘤细胞的进化方向,明确肿瘤细胞在不同进化阶段的关键基因。关键机制的识别是推荐新靶点、新适应症、优势人群、疗效预测的基础。若要利用好这些能力,还要引入了“三级跳”的第二级——数字孪生。在工程建设领域,有一种技术可以在云端建造一个工厂,现实工厂的生产状况、设备详情,甚至安全隐患都能反应在云端的“虚拟工厂”上——这就是数字孪生技术。在制药领域,数字孪生技术也有了自己的表达,那就是生物学的数字化。早在2014年,谷歌执行董事长Eric Schmidt在接受麦肯锡公司旧金山分公司全球资深董事James Manyika的采访时,就将生物学的数字化作为了一项颠覆性技术提出。对制药领域数字孪生概念来一场考古,我们发现,早在2007年欧洲就已经提出了肿瘤数字双胞胎的概念。2011年,欧盟就曾经资助过ContraCancrum项目,通过为恶性肿瘤的发展建模,在不同的生物复杂性水平上(例如血管生成、胚胎学、生物力学、医学图像分析等方面)更好地理解癌症,模拟对各种治疗方案的反应。「哲源科技」要把每个患者投射成生命功能的数字孪生体。有了上千种通路和细胞行为等功能的数字化模型后,免疫、代谢、应激、生长因子、抑制肿瘤、促进肿瘤等等复杂的生物学事件都可以被数字化,每个生物学事件都拥有了一个“仪表盘”。每一个患者的生命功能定量化地投射到这些仪表盘上面。找准基线样本做基线数据后,每个患者的每个仪表盘上面就有了自己的专属指示灯,哪个生命功能异常,一目了然了。19路围棋盘的361个落点,可以变幻出无数的棋路。同样,上千条细胞内确定性事件的数字化仪表盘可以组合模拟千变万化的疾病发生发展情况。拥有了这些生命功能的数字化仪表盘后,哲源的科学家们在解释人类基因组的这些变异的功能如何影响疾病的发生发展,如何影响用药疗效方面,达到了一个相对比较自由的状态。针对一个具体的病,一个具体的药,「哲源科技」的科学家们可以把用药前后患者的上千个数字化仪表盘数据拿出来做各种组合的分析,去分析响应患者和不响应患者到底是哪些生命功能层面出现了差异,去解释疾病,解释药物响应,解释耐药。有了基因组学和数字孪生技术后,AI制药公司就可以突破药物发现阶段、参与AI制药久未触达的——临床试验。由全球规模最大的生物技术行业组织之一BIO(Biotechnology Innovation Organization)、Informa Pharma Intelligence、QLS联合发布报告显示:过去十年,药物开发项目从1期临床到获得美国FDA批准上市的成功率平均为7.9%。很多情况下,临床试验成功与否与临床受试者的选择有关。阿斯利康提出的5R框架中的第四个R就是Right patient。一旦进入临床,化合物可能会因错误选择给患者的剂量而失效。此外,化合物可能因机制失效而失效,即药物靶向的机制在生理或病理生理(级联)机制中缺乏足够的相关性,这决定了下游的总体临床疗效。正是深刻感受到临床试验失败之痛,在数字孪生人仿真临床试验上,全球的监管机构甚至走在了技术之前。数字孪生可以仿真人类相同的生理活动,当科学家把“电子化的药物”给虚拟人使用后,便可以在计算机上观察药物的效果,为药物选择正确的病人。美国FDA和欧洲EMA都已建立计算机建模和仿真研究工作组。FDA认为,虽然当前评价产品安全有效性的仍然依赖实验室模型、动物模型和临床数据,但未来,通过建立细胞、组织和系统的计算机模型较好的预测医疗产品的安全有效性;通过计算机模型模拟临床试验方法显示治疗效果、患者特性及疾病变量的内部关系等将成为主要方法。「哲源科技」在PD-1/PD-L1单抗领域就模拟了临床试验,根据几百例真实患者数据,得出药物敏感和耐药特征,并在2万例以上数字孪生病人库进行大规模模式识别和仿真,完成了31个癌种的PD-1/PD-L1单抗单药响应情况的预测。值得一提的是,「哲源科技」的团队不仅对响应不响应做了二分法的判断,而且对每一个肿瘤病理型的4种临床响应情况(完全缓解CR、 部分缓解PR、疾病稳定SD、疾病进展PD)分别进行了预测。与目前国内各家药厂普遍获批的适应症做对照,确实可以获得与实际临床试验相似的结果。「哲源科技」已经掌握的临床试验仿真技术能力,可以为PD-1/PD-L1抑制剂提供更加精准的研发策略:
1、为PD-1/PD-L1抑制剂选择差异化的适应症或人群特征;
2、为目标适应症提供全新的机制性生物标志物,精准入组适用患者;
3、为目标适应症评估耐药情况,并基于耐药机制精准推荐联用方案,最大化可获益患者范围;
4、在临床试验早期阶段建立特异性药敏模型,帮助在后续的临床试验阶段落地药物的伴随诊断方案。
你的人生分岔口,AI都帮你想好了
无论是为了解决人类重大疾病,攻克新冠肺炎、艾滋病这样缺乏特效药的疾病,还是为了降低药企的研发成本,让患者用到更便宜的药物,我们都希望AI制药项目能尽快产业化。人们总说“人生如棋”。实际上,我们每个人生来都是一盘残局,接下来如何走棋,事关生老病死。我们希望AI制药能运用“千人千药”的能力,帮助每一个人赢得“这场棋局”。
近 期 活 动
----------------------------------------
----------------------------------------
联 系 我 们
进群交流、活动预约、转载、媒体互推
扫码添加运营者微信,备注「姓名+公司」
寻求报道、商务合作、投融资对接
扫码添加商务微信,备注「商务合作」
【投资人说】正在组建机构投资人社群、创业者社群、读者群、媒体群等,目前总人数已超10000人。
关注【投资人说】微信公众号,发送信息「进群」,与各行业精英直接交流,共同进步。
发现赞和在看了吗,戳下看看