36氪获悉,AI+合成肽新药研发企业「呈元科技」(Syneron Tech)近日完成数千万美元pre-A轮融资,由联想创投、格力产投共同领投。呈元科技成立于2022年4月,由创新工场塔尖孵化,先后获得创新工场旗下三只基金的种子轮及天使轮投资。成立不到一年间,呈元科技再次完成Pre-A轮融资。ChatGPT两月间用户破亿,生成式预训练大模型(GPT)展现出强大的语言生成能力。人工智能在互联网爆火,相关概念股多次涨停。36氪了解到,AI for Science 在学术界的热度高涨,尤其是生物技术领域,利用人工智能从数据中学习,减少试错是研究人员努力追求的目标。AlphaFold2在预测蛋白质结构上的成功拓宽了AI的应用前景,部分公司正通过AI技术在生物技术领域实现商业化应用。近期,呈元科技联合创始人兼CEO(首席执行官)张骁博士、联合创始人兼CAIO(首席人工智能科学家)高欣教授接受了36氪的采访,讲述AI在生物技术领域的商业应用进展,及呈元科技的技术开发现状。
呈元科技是创新工场塔尖孵化的、以自然语言处理(NLP)人工智能技术为核心的创新药研发企业。创始人张骁博士毕业于美国罗格斯大学化学与生物化学系,后进入投融资领域,创业前为易凯资本合伙人,带领团队完成过累计近400亿元的生物医药企业股权交易。2021年,张骁感受到生物科技行业正在发生根本性的变化,便开始思考中国生物科技公司的新出路。“回归生物技术高风险、高回报的本质,针对全球未满足临床需求,选择最具成药性的药物模态且采用最有效率的研发范式做原始创新”,成为张骁创立呈元科技的初心。经创新工场董事长兼CEO李开复介绍,高欣与张骁及另两位生物医药领域的华人科学家结识,并经过深入探讨后决定共同创立呈元科技,加盟成为公司的“Methodology Developer”和“Problem Solver”。高欣是清华大学计算科学与技术学士、滑铁卢大学计算科学博士、卡内基梅隆大学雷恩学者,目前任沙特阿卜杜拉国王科技大学(KAUST)计算机科学系终身正教授、计算生物学中心主任、及智慧医疗中心副主任。他在生物信息学及机器学习的期刊和会议上发表论文320多篇,总影响因子超过1500,是60余项国际发明专利的第一发明人。此外,“基于综合能力平衡、开放互信原则组建的核心团队”还包括担任联合创始人和CSO(首席科学官)的颜艳博士,其毕业于美国哥伦比亚大学分子生物学、药理学专业。创业前在葛兰素史克(GSK)美国研发中心工作17年,是肿瘤方向资深科学总监,负责过多个全球新(First in class) 抗癌药物从靶点验证到临床阶段全过程开发,有多个小分子和大分子药物获批经验,对肿瘤细胞、免疫细胞创新靶点及癌症治疗创新技术有深入研究。另一位联合创始人是全球穿膜肽领域科学家、美国俄亥俄州立大学终身教授裴德华,其曾是美国上市生物科技公司Entrada Therapeutics的科学创始人,2022年底Entrada Therapeutics与知名生物医药企业Vertex Pharmaceuticals 就治疗1型强直性肌营养不良症 (DM1)的临床前产品达成合作,首付款达$2.24亿美元。呈元科技的技术能力还体现在干湿实验闭环之中。张骁表示:“从最开始的立项环节,干湿实验团队就会进行交流和论证。”高欣告诉36氪:“干实验侧主要是做AI模型,然后采用高通量、湿实验侧的数据进行验证和下一轮迭代,在迭代的过程中不断改善模型。”据了解,呈元科技瞄准细胞内难以成药的蛋白-蛋白相互作用靶点(PPI),开发了针对合成肽药物的多目标生成式AI设计平台(SynCore)。
平台能力:AI+合成肽高通量实验
SynCore平台的核心基础与GPT类似,“呈元科技自去年7月就已经布局了多肽的预训练大模型,多个研究成果近期将发表在Nature子刊等国际顶尖期刊上。”高欣对36氪介绍道,“ChatGPT之所以有当前的智能化,是因为在GPT大模型的基础上加入了Chat,相当于累加了强化学习。强化学习的逻辑是利用环境或人提供的反馈对模型进行修正。”对于呈元科技而言,针对多肽药物设计的预训练大模型在概念上等价于“GPT”,该平台对多肽药物的多个成药性指标的优化,实质上是强化学习模型,可以看作是多任务版的“Chat”。据了解,ChatGPT是单模态的预训练大模型,仅对自然语言进行预训练;而呈元科技的大模型横跨多种模态,且不同成药性指标的同时优化问题也更加复杂。例如,需要考虑合成肽药物与靶点的亲和力、特异性,以及稳定性、免疫原性、穿膜性等多方面性质。具体来说,成药性指标优化方面,“呈元科技的模型在In Silicon(计算性能)和In Vitro(实验性能)的头对头比较方面,显示出一定优势。”此外,由于穿膜肽是前沿科学领域,高质量的公开数据有限,也是目前AI鲜为涉足的应用场景。呈元科技通过加大数据挖掘投入、以自产或合作方式获取大量数据、创新建模等方法,将穿膜性的预测准确度提高到92%。目前呈元科技已将超大规模预训练加多任务强化学习的平台,及蛋白质结构和交互作用建模的自主研发模型应用于多种应用场景和管线。在数据容量和流量方面,“呈元科技的合成肽高通量筛选及合成平台已经与AI平台形成干湿闭环,并在几个重磅靶点上完成了迭代,”高欣告诉36氪,“针对每个拟开发管线,提供超过10的10次方量级的合成肽数据作为训练集。”在模型整体上,呈元科技注重系统性设计和工程化,不同层次具备不同的分辨率和通量。此外,平台模型能够实现“内插值”和“外插值”,“基于已有多肽为起点做优化是内插值,从零生成具有目标成药性的多肽是外插值,呈元科技同时具备这些能力。”
谈到药物靶点和管线,张骁认为:“全球生物科技行业在发展方面已经遇到了一些瓶颈,传统的大分子或小分子药物开发空间越来越小,Me-Too、Fast Follow管线压力很大。AI能够大幅提升创新药的早期研发效率,因此呈元科技选择First-In-Class。”合成肽是一种全新的多肽类药物,传统多肽药物主要基于生物体内的天然肽改造而成,而合成肽是经过人工设计、合成的自然界不存在的多肽类化合物,且组成合成肽的氨基酸也并非全部天然。比起天然肽,合成肽具有结构刚性强、体内稳定性高、靶标亲和力强等性质;相比小分子,合成肽与靶标蛋白作用面积更大,结合更紧密,特异性更强;相比抗体等大分子药物,合成肽能够实现穿膜,作用于胞内大量“不可成药”靶点。此外,张骁还向36氪介绍了呈元科技基于合成肽的药物递送载体Syn-mask,“该载体具有肿瘤靶向性,能够延长药物半衰期、可在体内自然降解不会引发副作用。”以及穿膜肽平台BCP,“该平台可递送包括多肽、RNA、蛋白等多类型药物分子进入细胞内,具有较高的穿膜效率。”商业模式方面,张骁告诉36氪,“呈元科技会将First-In-Class的产品自主推进到临床阶段,并寻求与全球制药企业合作开发,也会依托平台技术开展对外合作。公司未来收入来源于交易的里程碑付款、销售分成以及平台技术合作收益。”据了解,日本多肽药物公司PeptiDream也有类似的商业模式,目前该公司已有4个产品进入临床Ⅰ期,当前市值约2300亿日元(约合人民币116亿)。据德勤律师事务所统计数据,2022年药物研发的平均预期回报率降到1.2%,是13年来观察到的最低的投资回报率。此外,德勤联合上海市科协发布的《中国生物医药创新趋势展望》指出,人工智能的运用可有效节约全球每年约280亿美元的新药研发成本。这一领域的技术创新和管线进展,值得长期关注。