Redian新闻
>
谷歌、OpenAI 都搞起了AI “造人”?创始团队:开源AI基因编辑器只是冰山一角

谷歌、OpenAI 都搞起了AI “造人”?创始团队:开源AI基因编辑器只是冰山一角

公众号新闻
译者 | 王强、华卫
策划 | 华卫

“AI 能编辑 DNA 了,还是开源版!”

OpenCRISPR-1 开源链接:

https://github.com/Profluent-AI/OpenCRISPR

今天,人工智能系统不止可以设计出创作诗歌、代码和视频的模型,还开发出了精确编辑人类 DNA 的开源工具。这不仅是 AI 的巨大进步,还预示着,将来科学家可以比现在更精确、快速地对抗各种疾病。

近日,美国一家名为 Profluent 的初创公司公开介绍了这项技术,并预计于下个月在美国基因和细胞治疗学会年会上发表相关论文。“使用人工智能技术创建基因编辑机制史无前例,”美国加州大学旧金山分校生物工程和治疗科学系教授兼系主任 James Fraser 表示。

据悉,Profluent 是在分析了大量生物数据后,通过对 CRISPR-Cas 序列进行人工智能算法建模来设计出高功能基因组编辑器,并将其命名为 OpenCRISPR-1。通过 OpenCRISPR-1,该公司的人工智能系统从大规模序列和生物学背景中学习,产生了数百万种自然界中不存在的 CRISPR 样蛋白,从而成倍扩大了几乎所有已知的 CRISPR 家族。

并且,OpenCRISPR-1 基因编辑器正在被开源。这意味着,其允许个人、学术实验室和公司免费试用该工具。很多研究人员都会把开发的人工智能底层驱动软件开源出来,让其他人可以在他们的成果基础上继续开发工作,以加速新技术的开发步伐,但像 OpenCRISPR-1 这类生物实验室和制药公司开源技术发明的情况并不常见。不过,Profluent 并没有开源该编辑器本身的技术内容。

Profluent 还透露,OpenCRISPR-1 只是冰山一角,他们的平台能够随意生成更多的基因编辑系统。然而,尽管目前 OpenCRISPR-1 还没有投入临床,但已经招致不少除应用效果以外的担忧。

完全由 LLM 驱动
将蛋白质多样性扩大 4.8 倍

在这项研究中,Profluent 展示了世界上第一个使用人工智能从头开始设计的分子的精确基因编辑。基因编辑器是复杂的系统,需要多结构域蛋白质、DNA 和 RNA 之间复杂的空间和时间相互作用。使用人工智能设计功能差异化的基因编辑器,代表了人工智能驱动生物设计蓬勃发展领域的重大飞跃。

OpenCRISPR-1 的技术是由人工智能驱动、Cas9 样蛋白和指导 RNA 组成,完全使用  Profluent 的大型语言模型(LLM)开发。该模型学习的是氨基酸和核酸序列,这些化合物定义了科学家用来编辑基因的微观生物机制。也就是说,它分析了从自然界中提取的 CRISPR 基因编辑器的行为,并学习该如何生成全新的基因编辑器。

“这些人工智能模型从序列中学习,无论这些序列是字符、单词、计算机代码还是氨基酸序列。”Profluent 首席执行官 Ali Madani 表示。

据介绍,生成蛋白质语言模型通常在跨越广泛功能的大型、多样化的天然蛋白质序列数据集上进行预训练,可以生成反映天然蛋白质特性的真实蛋白质序列。然而,对于特定的应用,如产生新的基因编辑器,就需要将模型引导到特定的目标蛋白质家族。

为此,Profluent 进行了详尽的数据挖掘,以构建迄今为止最广泛的 CRISPR 系统数据集,被称为 CRISPR-Cas 图谱。为生成新的 CRISPR-Cas 蛋白,他们又在 CRISPR-Cas 图谱上训练了一个蛋白质语言模型。

图:生成的序列极大地扩展了 CRISPR 相关蛋白质家族的多样性,以蛋白质簇的数量来衡量,图中显示了每个蛋白质家族在不同类型的 CRISPR-Cas 系统中被发现的频率。

从该模型中生成了 400 万个序列,并使用生物信息学技术来去除简并序列,确定每个生成的蛋白质属于哪个 CRISPR-Cas 家族后,他们发现,这些模型产生的蛋白质将几乎所有天然存在的 CRISPR-Cas 家族的多样性扩大了 4.8 倍,并且之后可以生成更多的序列进一步扩大这种多样性。

鉴于 SpCas9 的广泛采用和临床成功,其使用模型生成了可与 SpCas9 互操作的 Cas9 样蛋白,并选择了其中 48 个生成的序列,用于在人类细胞中进行严格的功能表征。他们发现,当与脱氨酶配对时,OpenCRISPR-1 和 SpCas9  在精确编辑靶基因组中的单个碱基时具有相似的活性和特异性。此外,他们还能够保持碱基编辑活性,同时使用由另一种 Profluent 训练的蛋白质语言模型生成的脱氨酶来提高特异性。

图:对于测试的 5 种生成的核酸酶中的 4 种,使用模型生成的 sgRNA 提高了编辑效率。

最后,为了进一步优化生成的核酸酶活性, Profluent 还训练了一个模型来为任何给定的 Cas9 样蛋白生成相容的 sgRNA。与 SpCas9 的 sgRNA 相比,这些生成的 sgRNA 可以提高所测试的五种蛋白质中四种产生的核酸酶的活性。

CRISPR 基因疗法的“升级版”

“我们与 OpenCRISPR 的意图是与尖端研究机构和药物开发人员合作,以一种强大而实用的方式安全地加速 CRISPR 基因疗法的开发。”Profluent 首席商务官 HilaryEaton 表示。

目前,基于 CRISPR 的技术已经改变了科学家研究和对抗疾病的方式,并提供了能够改变镰状细胞性贫血和失明等遗传疾病患者的治疗方法,但仍需加速发展以治疗数千种其他还无治愈之法的疾病。据介绍,OpenCRISPR-1 正是基于 CRISPR 的生物机制所构建。

源自微生物的基于 CRISPR 的基因编辑器虽然功能强大,但当移植到非天然环境(如人类细胞)中时,通常会显示出显着的功能权衡,人们希望能够生产出比经过数十亿年进化而来的天然基因编辑器更灵活、强大的基因编辑器。人工智能系统的设计恰恰能提供一种强大的替代方案,有可能绕过进化约束生成具有最佳属性的编辑器。

“我梦想着这样一个世界,我们可以在几周内按需提供 CRISPR。”美国加州大学伯克利分校创新基因组学研究所的基因编辑先驱兼科学主任 Fyodor Urnov 说。

事实上,OpenCRISPR-1 是整个业界努力构建可以改善医疗保健的人工智能技术的一个缩影。例如,华盛顿大学的科学家正在利用 ChatGPT 和 Midjourney 等图像生成器背后所采用的人工智能技术方法来组装全新的蛋白质,并致力于加速新疫苗和药物的开发。

“从长远来看,这可以通向一个快速为个人定制药物和治疗方法的时代,定制速度甚至比我们现在的还快。”Urnov 认为,生成式人工智能系统具有巨大的潜力,它们往往会通过从越来越多数据中学习的过程来快速改进自身。如果像 Profluent 这样的技术继续改进,其最终可以让科学家以更精确的方式编辑基因。

而目前看来, Profluent 也具备技术进化的资金支撑。3 月 21 日,Profluent 宣布完成 3500 万美元追加融资,融资总额达到 4400 万美元。这笔融资由 Spark Capital 领投,现有投资者 Insight Partners 和 Air Street Capital 以及来自 OpenAI、Salesforce、Octant Bio 和谷歌(包括谷歌 DeepMind 首席科学家 Jeff Dean)的天使投资人组成的财团也参与了投资。该公司此前还曾从 Insight Partners、Air Street Capital、AIX Ventures 和 Convergent Ventures 募集到 900 万美元种子轮资金。

临床可能引发副作用

虽然这项研究已经表明,人工智能模型可以生成能够编辑人类基因组的工具。但目前 Profluent 还没有对基因编辑器 OpenCRISPR-1 进行临床试验,因此尚不清楚其是否能达到或超过 CRISPR 的性能表现。

不过,可以确定的是,短期内这一技术进展不太可能影响医疗保健领域。Urnov 表示,事实上科学家们并不缺乏可以用来对抗疾病的天然基因编辑器,推动这些编辑器通过临床前研究的成本才是瓶颈所在,如安全性、制造和监管审查,经过这些步骤后才能将其用于治疗患者。

此外,这样的合成基因编辑器案例还引发了其他担忧。长期以来,科学家一直警告不要将 CRISPR 用于人类身体改造和治疗领域,因为这项技术相对较新,可能会产生引发癌症等不良副作用,还能提供一些不道德的用途,如对人类胚胎进行基因改造。

对此,Fraser 的看法是,“一个不道德的人,并不在乎他们使用的基因编辑器是不是人工智能创建的,他们只会继续使用现有工具。”

原文链接:

https://www.nytimes.com/2024/04/22/technology/generative-ai-gene-editing-crispr.html

https://www.biorxiv.org/content/10.1101/2024.04.22.590591v1

https://www.businesswire.com/news/home/20240422399482/en/Profluent-Successfully-Edits-Human-Genome-with-OpenCRISPR-1-the-World%E2%80%99s-First-AI-Created-and-Open-Source-Gene-Editor

https://www.profluent.bio/blog/editing-the-human-genome-with-ai

 内容推荐

探索智能科技的新边疆,《2024 年第 1 季度中国大模型季度监测报告》正式发布!OpenAI Sora 大模型和 NVIDIA Project GR00T 的发布、人形机器人的突破以及编码智能体的到来,正开启 AI 大模型的新纪元。在开源与闭源并行的新趋势中,AIGC 写作和 PPT 制作工具的测评展示了 AI 在内容创作和视觉呈现上的巨大潜力。InfoQ 研究中心邀您一同见证 AI 浪潮如何塑造未来🚀。欢迎大家扫码关注「AI 前线」公众号,回复「季度报告」领取。

 活动推荐

AICon 全球人工智能开发与应用大会暨大模型应用生态展将于 5 月 17 日正式开幕,本次大会主题为「智能未来,探索 AI 无限可能」。如您感兴趣,可点击「阅读原文」查看更多详情。

购票或咨询其他问题请联系票务同学:13269078023,或扫描上方二维码添加大会福利官,可领取福利资料包。


今日荐文


26岁带着百人团队冲刺大模型,面壁智能天才CTO:高效比参数更重要


神秘大模型一夜“征服”所有人,超GPT-4却无人认领?网友:OpenAI 要有大麻烦了


大模型开闭源争吵不休:开源落后闭源一年,决定模型能力的不是技术?


你也「在看」吗?👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
刚刚!全球首例猪肾移植患者死亡!基因编辑依旧无法破除活不过两月魔咒?童话世界,丹麦小镇Solvang诺奖得主Doudna最新演讲:基因编辑治疗价格太高,体内编辑是未来重要方向湖南大学聂舟团队Angew |工程化Anti-CRISPR蛋白创建CRISPR-Cas蛋白开关用于激活型基因编辑和病毒蛋白酶检测【首发】篆码生物完成数千万元种子轮融资,推进原创超小型高效基因编辑器研发Nature:人工智能赋能,科学家有望一键设计定制化的CRISPR基因编辑策略挺突然呀,OpenAI CEO奥特曼和他的丈夫承诺捐出大部分财富AI 时代,这个团队正在打造全世界最复杂的高性能编辑器斯坦福15张图揭示最新AI 动态:开源风评又“被害”,谷歌、OpenAI争当基础模型“劳模”OpenAI releases real基因编辑猪正在流向餐桌,市场会接受吗?我为什么不再向国内的亲友们呐喊?15.5k Star,开源在线实时协作文档编辑器带女儿海外旅居6年,我想说:“快乐教育只是国际学校的冰山一角…”AI可以改写人类基因组吗?首次由AI从头设计的基因编辑器成功编辑人类细胞中DNA“谋财害命”的小林制药,日本丑闻的冰山一角Tessera公布镰状细胞贫血症疗法数据,两次编辑效果可达44%,体内基因编辑或成更简单经济的方法世界首例!我国学者成功开展基因编辑猪肝脏的人体移植,迈出异种移植临床应用的关键一步【首发】引正基因完成新一轮融资,专注下一代基因编辑工具近一半人视力明显改善,Editas公布基因编辑治疗遗传性失明I/II期数据AI成功改写人类DNA,全球首个基因编辑器震撼开源!近5倍蛋白质宇宙LLM全生成英伟达市值超2.6万亿美元,揭秘黄仁勋的“疯狂”管理;谷歌、OpenAI打价格战;微软AI PC“叫阵”苹果 | 一周国际财经开源富文本编辑器Quill 2.0重磅发布创始团队与国资股东:融资决策背后的博弈【花样女神节】《光明》给泽西交作业「代理人战争」!微软、OpenAI 、谷歌、Meta用AI Agent疯狂搞钱UC网盘称不限速,我国医生将基因编辑猪肝植入人体,B站用户平均年龄达24岁,元梦之星回应被起诉,这就是今天的其他大新闻!全球首例基因编辑猪肾移植者去世,出院仅1个多月,院方称没有证据表明移植手术是死因2024年度邵逸夫奖揭晓:两位基因编辑疗法的开创者获奖!相差37岁!26岁男餐馆打工爱上老板63岁妈 大秀恩爱“造人成功”创始团队仅 3 人、估值最高 25 亿美元,万字长文讲述 RISC-V 商业帝国崛起背后的故事AI成功改写人类DNA:全球首个基因编辑器开源;浙江大学首次实现汉字书写脑机接口,“意念写字”成现实丨AIGC日报悉尼大学数百名学生AI作弊被抓!专家:可能只是冰山一角基因编辑猪获重大突破,有望今年内进入消费市场全球首次!基因编辑药物让22岁失明女子恢复视力再回首 (十)从以巴战争的态度看人的认知障碍
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。