Redian新闻
>
深势科技发布多模态科学文献大模型Uni-Finder:重新定义智能化文献阅读

深势科技发布多模态科学文献大模型Uni-Finder:重新定义智能化文献阅读

公众号新闻



对于科学研究和工业研发来说,深入阅读和分析文献都是一项关键却耗时的任务。深势科技推出的 Uni-Finder 正在改变这一局面。这个革命性的智能文献数据库平台,不仅提供高效的多模态检索功能,还能通过先进的自然语言交互技术灵活提取关键数据,大大优化了科学文献的理解和分析过程。

多模态科学文献大模型来了



在科研活动中,科学文献的阅读和分析是一个至关重要但极为耗时的步骤。以药物研发为例,研究人员需要阅读大量文献来分析特定靶点的关键作用区域,收集活性小分子的数据等。这一过程虽关键,却往往需要耗费大量的时间和人力资源。
传统的科学文献数据库,如 SciFinder,尽管提供了检索功能,却依旧让研究人员不得不人工筛选和阅读大量文献。此外,尽管像 ChatGPT 这样的大型语言模型在处理自然语言方面表现出色,但面对含有分子结构图、化学反应式等多模态元素的科学文献时,它们却显得力不从心。
针对这一挑战,深势科技推出了革命性的智能科学文献数据库平台 Uni-Finder,旨在进一步提升科学文献的阅读和分析效率。该平台不仅具备传统数据库(例如 SciFinder)的多模态检索功能,还能通过自然语言交互,在筛选结果中灵活且自动化地提取所需信息,如多个专利的共同中间体或与特定靶点相关的小分子活性数据。此外,由于其对科学多模态元素的精确理解,Uni-Finder 在科学文献的内容理解和问答方面的性能也优于其他大型语言模型。

Uni-Finder 的核心技术是深势科技自研的科学多模态大模型 Uni-SMT(Universal Science Multimodal Transformer)。不同于之前仅关注纯文本的大型语言模型,Uni-SMT 综合考虑了科学文献中的多模态元素,如图表、数学方程、分子结构表示和化学反应方程式等。它运用多模态对齐技术,实现了对科学文献的更全面和精确理解。例如,对于某些专利,Uni-SMT 能够通过多模态对齐技术同时理解 markush 式(带有可变基团的化学分子式)和文本中对可变基团的描述,从而精确地识别和解析专利的保护范围。

多模态能力评测


为了评估 Uni-Finder 在多模态元素理解方面的性能,我们将其与目前市场上流行的基于大型语言模型的文献分析工具进行了横向对比。比较的工具包括 ChatPDF, Claude 以及 GPT-4。我们的评测重点集中在几个关键功能上:分子结构图的识别、综合多模态信息的文献理解,以及判断特定分子是否受到专利中的 Markush 结构保护。从下表的评测结果(详见后续截图)可以看出,Uni-Finder 在处理和理解这些多模态元素方面表现出色,而其他基于传统大型语言模型的工具则大多未能准确理解这些元素。



产品使用场景:助力药物研发


随着信息时代文献数量的激增,科研人员在文献阅读和分析上花费大量时间,这影响了他们专注于核心研究的时间。Uni-Finder 应运而生,融合先进的多模态文献理解和灵活的自然语言处理技术,极大地提高了文献检索和分析效率。借助 Uni-Finder,科研人员可更高效处理科学文献,节省宝贵时间,集中精力解决科研难题
在一个模拟药物研发场景中,我们演示了 Uni-Finder 如何有效提高研究效率。研究人员关注SOS1靶点时,可通过 Uni-Finder 查询 SOS1 相关疾病和结直肠肿瘤信息。这为他们提供了关键科学知识,为后续研发工作打下了坚实基础。研究人员还可利用 Uni-Finder 的高级检索功能深入探索。选择“SOS1”靶点标签后,Uni-Finder 快速展示相关专利,证明了其在精准检索和信息筛选上的卓越性能。接着,研究人员对市场和科研趋势进行了全面分析。他们查看过去10年 SOS1 靶点的专利趋势,获取了市场动态和竞争环境的深刻洞察,辅助研发策略制定。通过 Uni-Finder 的跨文献分析,如骨架聚类,他们了解了该领域的最新进展和创新方向,为新药设计和开发提供了科学指引。最后,研究人员可深入分析特定专利。他们可以方便地审视保护的分子结构,提取高活性的实施例,并详细查看了特定实施例的信息。值得一提的是,通过上传分子结构图,并与 Uni-Finder 进行互动式对话,研究人员能够准确判断特定分子是否受当前专利保护。这一系列复杂分析突显了 Uni-Finder 在药物研发领域的强大实用性。

试用申请


一名药物研发领域的内测用户在试用了两周后表示:“Uni-Finder 基于便捷的对话式交互,能够在不超过10秒的时间内,就能够精准提供专利实施例中所使用的共有中间体,或者是活性最佳的实施例的编号及其结构;在一些复杂的专利和文献调研任务中,Uni-Finder 在几分钟内给出的信息,甚至堪比两名博士生调研一周的工作成果。”
Uni-Finder 现在也开放了更大范围的测试,如果您对 Uni-Finder 感兴趣,欢迎扫描下面的二维码(或点击文末的“阅读原文”)申请试用。

多模态能力评测详细结果


推荐关注




关于深势科技

深势科技是“AI for Science”科学研究范式的引领者和践行者,致力于运用人工智能和多尺度的模拟仿真算法,结合先进计算手段求解重要科学问题,为人类文明最基础的生物医药、能源、材料和信息科学与工程研究打造新一代微尺度工业设计和仿真平台。

我们开创性地提出了「多尺度建模+机器学习+高性能计算」的革命性科学研究新范式,并推出了Bohrium®科研云平台、Hermite®药物计算设计平台、RiDYMO®难成药靶标研发平台及 Piloteye™电池设计自动化平台等工业设计与仿真基础设施,颠覆了现有研发模式,打造“计算引导实验、实验优化设计”的全新范式。

深势科技是国家高新技术企业、国家专精特新“小巨人”企业,总部位于北京,并在上海、深圳等城市布局研发中心。科研技术团队由中国科学院院士领衔,汇集了超百位数学、物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师,其中公司的博士及博士后占比超过35%。核心成员获得过2020年全球计算机高性能计算领域的最高奖项“戈登贝尔奖”,相关工作当选2020年中国十大科技进展和全球AI领域十大技术突破。


👇点击“阅读原文”,即可申请试用

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
独角兽思谋科技发布IndustryGPT,打破全球工业大模型空白局面曝OpenAI大模型新进展!将推出多模态大模型,新项目Gobi筹备中美图视觉大模型将向公众开放;神经元科技发布AI agent“萨蔓莎”丨AIGC日报特别策划丨对话行业智能化先锋:宁夏大学,从300间未来教室迈向教育智能化上海内推 | 小红书多模态算法组招聘多模态CV/NLP算法实习生实现输入到输出「模态自由」, NUS华人团队开源NExT-GPT,最接近AGI的大一统多模态大模型来了重新定义中国的流程挖掘,望繁信科技成为先行者四喜烤麸—全素营养美味的家常菜Powder Valley自然保护区李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大西交、清华等发布多模态大模型,有望成为「DALL·E 4」技术路线?和AI一起「白日作梦」北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型UC伯克利等发布多模态基础模型CoDi-2;谷歌DeepMind利用AI工具发现200万种新材料丨AIGC日报大反转!奥特曼回归OpenAI ?;微软发布人工智能芯片;百度李彦宏:重复造大模型是浪费;阿里巴巴、百川智能、极睿科技等最新消息文档字越多,模型越兴奋!KOSMOS-2.5:阅读「文本密集图像」的多模态大语言模型[9月26日]科学历史上的今天——金·赫尔尼(Jean Amédée Hoerni)望繁信科技发布数字北极星3.0,为中国重新定义流程挖掘|甲子光年大模型重新定义软件开发,将带来哪些改变?| 《架构师》10月刊开放下载横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%Ask-paper全新升级上线,AI文献阅读助手助您轻松驾驭文献海洋!超越ChatGpt!​AAAI 2024 | 首个多模态实体集扩展数据集MESED和多模态模型MultiExpan兵败如山倒系列:我们惨败于推娃大妈ICCV 2023 | 通向3D感知大模型的必由之路!UniTR:统一多模态Transformer Encoder!阿斯麦尔能听命多久?重新定义智能充电桩,「无尽瓦特」获顺为领投近1.5亿元天使轮融资丨36氪独家UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源破解一切模态,无限接近AGI!新加坡华人团队开源全能「大一统」多模态大模型CNN能搞多模态了!UniRepLKNet:大核CNN一统多种模态,图像/视频/点云/时序/音频均达SOTA水平!华为提出全面智能化战略,加速千行万业的智能化转型北大&腾讯打造多模态15边形战士!语言作“纽带”,拳打脚踢各模态,超越Imagebind​又爆了!来自C9博士的文献阅读指南红色日记 计划盖房 4.1-30科研上新 | 语言-音乐对比预训练;查找表实现的神经网络推理;大模型时代重新定义搜索框架重磅课程再次升级,一次性搞定大模型多模态AIGC与强化学习 --《2023秋季AIGC大模型与强化学习前沿技术实战》 招生简章
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。