Redian新闻
>
千亿级数学大模型MathGPT推出 即日起开放内测

千亿级数学大模型MathGPT推出 即日起开放内测

公众号新闻

覆盖小学到高中段数学解题,测试结果优于GPT-4。
编辑 |  三北
智东西8月24日报道,今日,在好未来20周年直播活动中,好未来CTO田密宣布推出好未来自研的数学领域千亿级大模型MathGPT并开启内测。即日起,用户可通过官网(www.mathgpt.com)申请注册账号免费试用体验。
今年5月,好未来曾公布正在进行自研数学大模型的研发,命名为MathGPT。MathGPT是面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直领域的大模型,也是国内首个专为数学打造的大模型。
用户使用MathGPT时,用文字或图片方式上传数学题,即可得到对话式的解答反馈,也可以通过“随机来一题”的按钮,随机生成数学题目并由系统给出解答。目前,MathGPT支持中文、英文版本的PC端和移动端体验。


01.
覆盖小学到高中段数学解题
测试结果优于GPT-4


田密介绍,MathGPT汇集了好未来多年教育教研数据积累,专注于数学领域。千亿级大模型的训练、推理、部署框架,为模型赋予了强大能力。通过优质教育数据,实现题目计算、讲解、问答等多任务持续训练和有监督微调,呈现出卓越表现。此外,借助人类反馈对齐,还将进一步提升模型综合素养。MathGPT在解题准确率、稳定性及用户体验方面均有明显的优势。
MathGPT官网显示,MathGPT的数学计算能力已覆盖小学、初中、高中的数学题,题目类型涵盖计算题、应用题、代数题等多个类型,还可以针对题目进行追问,暂未开放数学之外的问答互动。

▲MathGPT技术报告

▲MathGPT在C-Eval榜单初高中各科成绩
MathGPT技术报告显示,在CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学和Math401等6个公开数学评测集合的测试结果中,好未来的MathGPT取得了多项测试的最高分数。同时,MathGPT在C-Eval的初高中的全科测试集合上也均有不错的表现。
在解题稳定性、讲解友好度方面,MathGPT基于海量名师解题过程的数据进行模型训练,模型的解题步骤专业清晰。
以一道数列题为例,MathGPT给出的答案包含“分析”、“详解”、“点睛”三个部分,比通用大模型的粗略讲解方式更为细致,“分析”提供了题目的解题思路、思考方式,帮助用户更好地理解题目,“详解”则给出具体的计算方式和答案,最后“点睛”的环节,对题目的考点、难点、关键点进行提示,帮助用户回顾反思出题意图、举一反三。

对于使用者而言,研究数学问题不仅在于得到答案本身,更在于答案背后的解题原理、思路逻辑。与其他通用大模型相比,MathGPT能实现更高准确度的解题,也能把答案解析得更清楚、讲解得更明白,更好地满足用户使用AI产品解答数学问题的核心需求。
在MathGPT发布同时,好未来也在官网更新了一个具有代表性和挑战性的数学任务评测集,供全球人工智能专家、数学爱好者体验和测评。田密介绍,希望让MathGPT在数学教育领域发挥更大作用,好未来愿意把基于大规模、高质量的内容的千亿级大模型研发经验方法和业内分享,和行业共同进步。

02.
20年数学积累
2017年布局AI实验室


在AI浪潮的推动下,今年以来多家科技公司宣布推出通用大语言模型产品,而好未来选择了另一个方向,不基于将现有大语言模型做微调和接口调用、不做通用大语言模型,而是深入数学的垂直领域研发大模型,致力于打造自主、稳定、可持续、高质量的数学解决方案。
通用大模型“重文轻理”,在数学问题的解决、讲解、问答和推荐方面则存在明显的短板。而在另一个层面,在通往通用人工智能的路上,数学推理能力很重要,全球有很多大型公司在做这方面的研究。
“好未来在数学的数据和业务上有20年的积累,有大量的教育数据的积累和持续生产教育数据的能力,所以选择做这个难而正确的事情。”田密称,好未来希望用自己在数学和AI上的多年积累,做好AI大模型时代的数学基础工作。
早在2017年,好未来便成立了AI lab人工智能实验室。基于智慧教育人工智能开放创新平台助力,好未来AI lab获得各类顶级学术会议比赛冠军16项,亚军6项,发表国际期刊和会议高水平学术论文近百篇。
2019年,科技部宣布依托好未来建设智慧教育国家新一代人工智能开放创新平台,好未来成为教育行业首批唯一一家人工智能“国家队”成员,在人工智能领域有多年深入研究。多年来,好未来以教育行业重大需求为牵引,构建了面向教育的人工智能算法能力、应用解决方案、基础软硬件体系和开源开放服务的国家教育科技创新平台。
好未来也在积极参与推动大模型标准体系建设,先后作为核心单位参与了由国家人工智能标准化总体组组织的大模型系列国家标准、中国信通院牵头编制的“大模型预训练模型技术和应用评估方法”系列团体标准,以及教育部教育信息化技术标准委员会暨全国信息技术标准化技术委员会主导的“教育通用大模型”系列标准编制工作。
近期,好未来正作为牵头单位与中国信通院、复旦大学、科大讯飞、百度等行业领先科研机构、高校、企业一同编制教育大模型团体标准,从覆盖场景、应用成效、服务可靠等维度全面评估教育大模型能力,为教育大模型应用落地提供参考与指导。

03.
用AI实现大规模因材施教


随着大语言模型的兴起,如何用AI技术服务各行各业是社会关注的焦点。教育行业是最早开始布局AI领域的行业之一,AI能为教育生态带来何种变化一直备受关注。
“AI带来了重新定义教育行业的机会,大模型技术使得大规模的因材施教真正有了实现的可能。”田密介绍,20年来,好未来一直在探索个性化学习,从线下小班到线上大班,再到AI课,形式不断进化,但教的内容始终是固定的、学生和老师互动较少、颗粒度只能到题目级别。
田密认为,大模型的本质,是一种更高效的、从数据中学习知识并加以应用的方式。在AI能力的加持下,“学生自学+AI答疑”的新型学习方式成为广泛的可能。学习者获得优质教学内容的门槛、成本降低,获得的教学内容个性化、精细化程度持续升高,可以实现千人千面的AI教学和答疑辅导,每个学生都能得到最适合自己的学习内容。
以MathGPT为基础,好未来将不断探索AI环境下的学习方式,更好地服务于全球的学习者、数学爱好者,并将经验及时与行业分享,通过AI技术助力教育科技的积极改变。
据田密介绍,随着内测的顺利进行,MathGPT的解题能力将得到持续提升,基于MathGPT的产品级应用也正在加速研发中,将于近期发布。

2023全球AI芯片峰会预告

9月14-15日,2023全球AI芯片峰会(GACS 2023)将登陆深圳。清华大学教授、中国半导体行业协会副理事长、IEEE Fellow魏少军,上海交通大学计算机科学与工程系教授梁晓峣,NVIDIA 解决方案与架构技术总监张瑞华,AMD人工智能事业部高级总监王宏强,亿铸科技创始人、董事长兼CEO熊大鹏,后摩智能联合创始人、研发副总裁陈亮等20+位嘉宾已确认参会和演讲。欢迎报名。






微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
李开复的新AI公司登陆大模型战场,百亿级模型已内测|最前线教科书级数据is All you Need: 1.3B小模型逆袭大模型的秘密ChatGPT重大更新!prompt推荐瞬间解释超导,GPT-4成默认模型今天,国内首个数学千亿大模型 MathGPT 上线开启公测​参数少近一半,性能逼近谷歌Minerva,又一个数学大模型开源了浮世万千 有喜有悲天猫精灵大模型终端OS开启内测!智能家居+ChatGPT还有什么新花样?火山引擎推出大模型平台;云知声提交上市申请;联通推出首个运营商大模型丨AIGC大事日报最新!2024年香港AP考场即日起开放报名!万物皆可数学?全美殿堂级数学本科项目,替你敲开高薪行业的大门!ChatGPT推出自定义指令:说一次就记住,每次对话都能遵守ChatGPT暂停集成Bing搜索;英伟达收购AI创企OmniML;天猫精灵启动大模型终端操作系统内测丨AIGC大事日报英伟达推出大模型加速包;Meta将训练对标GPT-4的大模型;ChatGPT等成费水大户丨AIGC大事日报历史小说《黄裳元吉》第一百零五章 变风千亿级、数学专用,MathGPT大模型开始公测了我在怀念什么微信内测“划线卡片”功能;抖音推出“闪电搜索”App;小红书双11将投入百亿流量扶持和亿级补贴 | 一周简讯还在担心辅导不了孩子数学?AI家教MathGPT来了!精确率提升7.8%!首个多模态开放世界检测大模型MQ-Det登NeurIPS 2023UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源全面拥抱大模型!腾讯正式开放全自研通用大模型:参数规模超千亿、预训练语料超 2 万亿 tokensGPT-3.5 Turbo推出微调功能;昆仑万维天工AI搜索引擎内测;阿里云等联合发布教育大模型孩子读不懂数学题怎么办?今晚7点半,名师来支招,一起读懂数学、爱上数学!|中国教育报数学阅读行动突发!刚刚宣布:全体在职人员注意!即日起开始实行!华为客服回应充电器不支持iPhone15; 蔚来否认30亿美元融资传言;OpenAI将在ChatGPT推出新语音图像功能丨邦早报1300亿参数,国内首个数学大模型MathGPT上线!多项基准赶超GPT-4蔚来优惠 2.4 万销售 ET5 库存车;微软 AI 建议游客去慈善机构吃饭引热议;「快手 AI 对话」开放内测 | 极客早知道阿里达摩院免费开放100件AI专利;字节推出大模型MBTI测试结果;ChatGPT自定义功能扩展免费丨AIGC大事日报引领手机向“全知全能”进化!iOS版ChatGPT推出联网模式:集成Bing搜索功能,仅对付费用户开放原来GPT-4是i型人格!大模型MBTI测试来了,来自字节34B参数量超越GPT-4!「数学通用大模型」MAmmoTH开源:平均准确率最高提升29%「陶哲轩×GPT-4」合写数学论文!数学大佬齐惊呼,LLM推理神助证明不等式定理普京自毁长城?实测学而思MathGPT大模型:中小学数学解题正确率有望在全球范围内创造新 SOTA巴哈马拿骚(Nassau),海景大观
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。