Redian新闻
>
今天,国内首个数学千亿大模型 MathGPT 上线开启公测

今天,国内首个数学千亿大模型 MathGPT 上线开启公测

公众号新闻

来自:好未来

进NLP群—>加入NLP交流群


8月24日,在好未来20周年直播活动中,CTO田密宣布好未来自研的数学领域千亿级大模型MathGPT正式上线并开启公测。即日起,用户可通过官网https://www.mathgpt.com/,或点击文末“阅读原文”申请注册账号免费试用体验。


今年5月,好未来曾公布正在进行自研数学大模型的研发,命名为MathGPT。MathGPT是面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直领域的大模型,也是国内首个专为数学打造的大模型。


用户使用MathGPT时,用文字或图片方式上传数学题,即可得到对话式的解答反馈,也可以通过“随机来一题”的按钮,随机生成数学题目并由系统给出解答。目前,MathGPT支持中文、英文版本的PC端和移动端体验。



田密介绍,MathGPT汇集了好未来多年教育教研数据积累,专注于数学领域。千亿级大模型的训练、推理、部署框架,为模型赋予了强大能力。通过优质教育数据,实现题目计算、讲解、问答等多任务持续训练和有监督微调,呈现出卓越表现。此外,借助人类反馈对齐,还将进一步提升模型综合素养。MathGPT在解题准确率、稳定性及用户体验方面均有明显的优势。


MathGPT官网显示,MathGPT的数学计算能力已覆盖小学、初中、高中的数学题,题目类型涵盖计算题、应用题、代数题等多个类型,还可以针对题目进行追问,暂未开放数学之外的问答互动。


MathGPT技术报告


MathGPT技术报告显示,在CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学和Math401等6个公开数学评测集合的测试结果中,好未来的MathGPT取得了多项测试的最高分数。同时,MathGPT在C-Eval的初高中的全科测试集合上也均有不错的表现。


MathGPT在C-Eval榜单初高中各科成绩


在解题稳定性、讲解友好度方面,MathGPT基于海量名师解题过程的数据进行模型训练,模型的解题步骤专业清晰。


以一道数列题为例,MathGPT给出的答案包含“分析”、“详解”、“点睛”三个部分,比通用大模型的粗略讲解方式更为细致,“分析”提供了题目的解题思路、思考方式,帮助用户更好地理解题目,“详解”则给出具体的计算方式和答案,最后“点睛”的环节,对题目的考点、难点、关键点进行提示,帮助用户回顾反思出题意图、举一反三。



对于使用者而言,研究数学问题不仅在于得到答案本身,更在于答案背后的解题原理、思路逻辑。与其他通用大模型相比,MathGPT能实现更高准确度的解题,也能把答案解析得更清楚、讲解得更明白,更好地满足用户使用AI产品解答数学问题的核心需求。


在MathGPT发布同时,好未来也在官网更新了一个具有代表性和挑战性的数学任务评测集,供全球人工智能专家、数学爱好者体验和测评。


田密表示,希望让MathGPT在数学教育领域发挥更大作用,好未来愿意把基于大规模、高质量的内容的千亿级大模型研发经验方法和业内分享,和行业共同进步。


以MathGPT为基础,好未来将不断探索AI环境下的学习方式,更好地服务于全球的学习者、数学爱好者,并将经验及时与行业分享,通过AI技术助力教育科技的积极改变。


随着公测的进行,MathGPT的解题能力将得到持续提升。据田密介绍,基于MathGPT的产品级应用也正在加速研发中,将于近期发布。



进NLP群—>加入NLP交流群

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
阿里100瓶毒药解马斯克难题?国内首个大模型价值对齐数据集开源,15万评测题上线!国内首个网文大模型来了!「阅文妙笔」:我最懂网文Python 吞噬世界,GPT 吞噬 Python!ChatGPT 上线最强应用UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源大模型帮陶哲轩解题、证明数学定理:数学真要成为首个借助AI实现突破的学科了?Python吞噬世界,GPT吞噬Python!ChatGPT 上线最强应用:分析数据、生成代码都精通千亿级数学大模型MathGPT推出 即日起开放内测早财经丨超级黄金周将至,国内热门酒店预订量暴涨超5倍;申遗成功!我国再添一处世界遗产;国内首个研究生商业性助学贷款产品落地Python 吞噬世界,GPT 吞噬 Python!ChatGPT 上线最强应用:分析数据、生成代码都精通国内首批通过备案上线的8款AI大模型产品4个月狂揽两千万,国内首个披露营收的大模型来了!国内首款开源交通大模型TransGPT(致远),可免费商用接入Llama 2等33个大模型,上线Prompt模板,百度智能云千帆大模型平台重磅升级AI大事件!复旦大学携手阿里云,国内首个高校智算平台来了马斯克xAI创始成员国内首发声:ChatGPT时代「乱世出英雄」,下一步要多用数学科学数据训练1300亿参数,国内首个数学大模型MathGPT上线!多项基准赶超GPT-4以小时为单位更新,国内首款医疗大模型如何炼成给大模型持久记忆!GitHub 2万星向量数据库云服务升级,国内云产品7月上线桃夭双林奇案录第三部之川黔连环案: 第三十三节周末随笔-灾后重建的一天英伟达推出大模型加速包;Meta将训练对标GPT-4的大模型;ChatGPT等成费水大户丨AIGC大事日报吴世春:梅花创投为什么参与筹建国内首个数字人AI基金?实测学而思MathGPT大模型:中小学数学解题正确率有望在全球范围内创造新 SOTA国内首个“AI 原生应用商店”上线!六月驕傲出櫃飞到旧金山在水上降落还在担心辅导不了孩子数学?AI家教MathGPT来了!34B参数量超越GPT-4!「数学通用大模型」MAmmoTH开源:平均准确率最高提升29%纪源圈|探迹 SalesGPT重磅发布,业内首个销售大模型SaaS产品研发首批AI大模型获批上线,BATH在列;华为Mate 60开售即火,接入盘古大模型;AI操控无人机能力超越人类冠军丨AI周报ChatGPT访问骤降,国产大模型弯道超车机会来了?2万星GitHub项目亮剑,国内产品7月上线大模型刷新教育赛道,网易有道发布国内首个教育大模型“子曰”千亿级、数学专用,MathGPT大模型开始公测了国内首个视频垂直大模型发布!一句话生成科幻大片预告,人人可玩
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。