Redian新闻
>
上海AI实验室开源科学大模型,理科能力全线提升,免费商用

上海AI实验室开源科学大模型,理科能力全线提升,免费商用

公众号新闻
允中 发自 凹非寺
量子位 | 公众号 QbitAI

最新科学大模型浦科化学(ChemLLM),发布即开源!

这是上海AI实验室最新开源成果,它基于书生·浦语2.0强大的基座模型能力,通过注入海量化学专业数据,使大模型获得理解和处理化学相关专业任务的知识与能力。

值得一提的是,在获得化学能力同时,大模型的数理学科及推理能力还得到增强。

目前该模型支持免费商用。

化学领域超越ChatGPT

浦科化学具备专业的化学知识能力。

可以精准翻译研究论文中的各种专业名词:

还能回答高中化学试题,并给出解释。

在多项测试中,浦科化学的表现都大幅超过其他模型。

研究人员通过3个任务来测试模型专业能力:

  • 分子名称转换

  • 分子性质预测

  • 反应产物预测

这些任务分别涉及化学物质的表示、性质和转化,是化学研究的基础和核心。

分子名称转换要求模型能够在不同分子表示方式之间进行准确转换,如SMILES、IUPAC名称、分子式等。

分子性质预测方面,要求模型能根据分子的结构和组成,预测其化学性质,如沸点、密度、溶解度等。

反应产物预测方面,要求模型能根据给定的反应物和反应条件预测反应产物的结构。

结果显示,浦科化学在这三项任务上均表现出色,分别获得22.0、49.0和7.0的分数,远超过其他同规模模型的水平,并超越了GPT-3.5,证明浦科化学在理解和处理化学知识方面具备强大能力。

泛理科能力涌现

在化学能力提升的同时,浦科化学在数学、物理及推理方面的能力也都得到提升。

研究人员使用MMLU(大规模多任务语言理解数据集)作为测试集来评估浦科化学在通用场景下的性能,对语言模型的多项任务能力进行测试评估,并将浦科化学与其他同等规模的模型进行比较,以评估化学训练数据对基础模型的影响。

评测结果显示,浦科化学在大学化学任务上得分为47.0,超越了所有其他模型。

研究人员发现,尽管没有对浦科化学进行数学和物理学科的训练,模型在大学数学、大学物理、STEM(科学、技术、工程和数学)类等相关领域上也获得了最佳成绩。

同时,浦科化学在形式逻辑任务上也达到了最高水平。

上述结果表明,当对大模型进行进行化学专业训练时,其数理及推理能力也能得到增强。

有趣的是,浦科化学在道德场景、人文科学类、社会科学类等分项任务上也展现了优异的平均性能,这说明,对大模型进行专业某个学科的知识训练,不仅不会让大模型“分心”,反而有助于其道德水平及一般任务水平的提升。

据了解,上海AI for Science团队面向化学、物理、生命、地球等科学领域,通过深入研究各学科基础理论,结合最新人工智能理论,探索AI驱动重大科学问题的研究范式,加速人工智能在化学、药物研发、新材料、气象等领域的渗透与落地。

其中,AI for Chemistry方面的研究以语言模型为核心,通过大模型连接智能化实验设备,全方位提升实验效率,从而实现化学研究的自动化和智能化。相关研究范式的创新,将助推科学发现速度,实现更大的社会效益。

未来,基于浦科化学模型,人工智能可为化学研究提供智能化辅助,如化学合成路径规划、化学反应条件优化、实验结果自动化分析等,从而提升化学研究的效率和质量。

开源地址:
https://huggingface.co/AI4Chem/ChemLLM-7B-Chat

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
AI早知道|马斯克Grok大模型开源;荣耀正式发布首款AI PC;苹果谷歌和OpenAI商谈iPhone大模型使用徐刍:数字空间坠落的流星个人感慨之四十九Meta光速下架的模型Galactica,上交大用它构建地球科学大模型幻方量化开源国内首个MoE大模型,全新架构、免费商用360安全大模型3.0来了!垂直大模型,他们这么训国产开源模型标杆大升级,重点能力比肩ChatGPT!书生·浦语2.0发布,支持免费商用字节发布机器人领域首个开源视觉-语言操作大模型,激发开源VLMs更大潜能腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法GPT-4级模型Grok开源可商用!卷底层大模型的公司危了打通大模型训练任督二脉!国内首个千亿参数、全面开源大模型来了,还联手开发者共训今日arXiv最热NLP大模型论文:北京大学警惕ChatGPT等大模型遏制人类的创新能力通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度浪潮信息发布“源 2.0”,千亿参数大模型开源可商用机器人领域首个开源视觉-语言操作大模型,RoboFlamingo框架激发开源VLMs更大潜能最新千亿大模型免费商用:1026亿参数,无需授权!诚邀开发者共同训练吃喝嫖赌抽,五毒中哪一样是最毒?开源大模型火了!(附99个大模型微调模型/数据/工具)!我的父亲孙梅生教授苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型AI早知道|苹果播客应用新增转录功能;上海智能实验室推图文多模态大模型;国产短剧AI换脸出海降本增效热议!澳留学生年入$10万算不算高薪?应届生起薪上涨9%,理科状元亲述:如何选专业才能成功拿offer百图生科刘维:生命科学大模型可以走通打破奥数天花板!DeepMind最新AI数学大模型,能以人类金牌水平解决几何题谷歌DeepMind机器人成果三连发!两大能力全提升,数据收集系统可同时管理20个机器人谷歌最强开源大模型亮相!Gemini技术下放,笔记本就能跑,可商用上海内推 | 上海人工智能实验室浦视开源体系团队招聘音频生成方向实习生千元成本搞定专业大模型,系统优化+开源大模型是关键 | 潞晨卞正达@MEET2024为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用宇宙人(1402期)世界最深最大的地下实验室正式投入科学运行;英劳斯莱斯公司公布月球核反应堆模型;美“在轨火控支援斗士”卫星星座重新划线提升安全,纽约商业垃圾收集拟大改今日arXiv最热大模型论文:何恺明重提十年之争——模型表现好是源于能力提升还是捕获数据集偏见720亿参数大模型都拿来开源了!通义千问开源全家桶,最小18亿模型端侧都能跑咀外文嚼汉字(297)日本人的 “绝活”(1)“部活”秒杀700亿Llama 2!最新国产大模型亮相,无需申请即可免费商用,背后公司来自私募巨头
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。