国际科技财经博客移民网络热点娱乐民生时事公众号

>

Uni-Mol：分子3D表示学习框架和预训练模型项目原作解读

Uni-Mol：分子3D表示学习框架和预训练模型项目原作解读

公众号新闻

2022-10-11 04:10

预训练模型正在席卷 AI 领域。从大规模无标注数据中提取表征信息，再在小范围标注的下游任务上进行监督学习，正在成为很多领域的事实解决方案。NLP 中有 BERT、GPT-3，CV 中有 ViT，而这样的模式如何助力药物设计，也一直都是人们密切关注的问题。药物分子与图片、语言文字的不同之处在于，“什么是最好的分子表征”依旧是一个人们未能形成共识的问题。主流分子预训练模型均从一维序列或二维图结构出发，但分子结构本身是在三维空间中表示的。能否直接从三维信息出发构建预训练模型、获得更好的分子表征，是一个重要而有意义的问题。

近日，深势科技团队发布了首个三维分子预训练模型 Uni-Mol。Uni-Mol 直接将分子三维结构作为模型输入，而非采用一维序列或二维图结构，在利用 2 亿个分子三维构象和 3 百万个蛋白候选口袋数据进行预训练后，Uni-Mol 在几乎所有与药物分子和蛋白口袋相关的下游任务上都超越了 SOTA（state of the art），也让 Uni-Mol 得以能够直接完成分子构象生成、蛋白-配体结合构象预测等三维构象生成相关的任务，并超越现有解决方案。

分享主题：Uni-Mol分子3D表示学习框架和预训练模型

分享嘉宾：郑行，深势科技算法研究员，博士就读于北京大学计算生物物理方向，主要研究方向为小分子虚拟筛选、分子表示学习、分子生成等，致力于将 AI+Science研究范式应用在解决药物设计的实际问题中。

分享摘要：Uni-Mol 是深势科技发布的首个三维分子预训练模型。基于通用的三维分子表示学习（MRL）框架，Uni-Mol 在几乎所有于药物分子和蛋白口袋相关的下游任务上都超越了 SOTA，并能直接完成分子构象生成、蛋白-配体复合物结合结构预测等三维结构相关的任务。

相关链接：

项目地址：

https://github.com/dptech-corp/Uni-Mol

论文地址：

https://chemrxiv.org/engage/chemrxiv/article-details/628e5b4d5d948517f5ce6d72

Uni-Mol: A Universal 3D Molecular Representation Learning Framework

加群看直播

直播间：关注机器之心机动组视频号，北京时间 10 月 13 日 19:00 开播。

交流群：本次直播设有 QA 环节，欢迎加入本次直播交流群探讨交流。

如群已超出人数限制，请添加机器之心小助手：syncedai2、syncedai3、syncedai4 或 syncedai5，备注「Uni-Mol」即可加入。

如果你也有最新工作希望分享或提交你感兴趣的内容方向，随时告诉我们吧：https://jiqizhixin.mikecrm.com/fFruVd3

机器之心 · 机动组

机动组是机器之心发起的人工智能技术社区，聚焦于学术研究与技术实践主题内容，为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动，欢迎所有 AI 领域技术从业者加入。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

Huge and Efficient! 一文了解大规模预训练模型高效训练技术再掀强化学习变革！DeepMind提出「算法蒸馏」：可探索的预训练强化学习Transformer Diffusion预训练成本降低6.5倍，微调硬件成本降低7倍！Colossal-AI完整开源方案低成本加速AIGC产业落地华南理工TANGO项目原作解读: 文本驱动的三维物体风格化模型 PyTorch和TensorFlow迎来后浪！工业界到底需要怎样的机器学习框架？基于无监督预训练的语音识别技术落地实践火山语音表示有话要说本来高高兴兴,一回头,惊险的一幕发生了稠密检索新突破：华为提出掩码自编码预训练模型，大幅刷新多项基准 8/16 波士顿新闻汇总｜新任警察局长Michael Cox正式就职麻州表示学校不再使用口罩橙线关闭维修将造成重大交通延误 NeurIPS 2022 | AutoMTL：第一个自动化多任务学习编程框架！AI画画模型成本被打下来了！预训练成本直降85%，微调只需单张RTX 2070，这个国产开源项目又上新了 3D版DALL-E来了！谷歌发布文本3D生成模型DreamFusion，给一个文本提示就能生成3D模型！已成功移植全球首例3D生物打印耳朵！3D Bio Therapeutics引领3D生物打印技术别的简报｜“请勿用止咳药炖鸡” —— 美国人表示学到了医疗多模态预训练：如何利用非天然配对的医疗图像和文本做对比学习？GENIUS: 根据草稿进行文本生成的预训练模型，可用于多种NLP任务的数据增强【兔卡司tu-cast】升级的俄乌战争；“正义战”框架和舆论战 COLING 2022 | CogBERT：脑认知指导的预训练语言模型清华CodeGeeX项目原作解读：大规模多语言代码生成模型 Neural Eigenmap: 基于谱学习的结构化表示学习自监督榜首！字节跳动提出视觉预训练模型dBOT，重新审视Masked Image Modeling 加速训练定制化BERT，ExtremeBERT工具包助力轻松快速预训练希腊圣岛-1：行走在蓝白世界（住/行信息）多模态预训练模型指北——LayoutLM 细粒度语义理解超越CLIP！华为云与浙大联合发布多模态预训练模型LOUPE，无需人工标注，零样本迁移实现目标检测！我们老中说秃噜嘴的那些英文！Nature子刊：精准预测分子性质和药物靶标的无监督学习框架系统回顾深度强化学习预训练，在线、离线等研究这一篇就够了 EMNLP 2022 | SentiWSP: 基于多层级的情感感知预训练模型全球一半病例在中国！Nat Struct & Mol Biol：科学家发现生物标志物的新形态，有望解开帕金森病诊断难题！八月的故事，母女爱恨难解难分用一个动作拥有全世界（多图）EMNLP 2022 | 稠密检索新突破：华为提出掩码自编码预训练模型厉害了！！！提示学习（Prompt）用在推荐系统上直播课预告：多模态预训练大模型OmModel及视觉应用开发

热点事件追踪