Redian新闻
>
学而思研发面向全球数学爱好者大模型MathGPT

学而思研发面向全球数学爱好者大模型MathGPT

公众号新闻

机器之心发布

机器之心编辑部


面向全球数学爱好者和科研机构

计划于年内推出


据了解,学而思正在进行自研数学大模型的研发,命名为 MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。


据悉,学而思已将 MathGPT 作为公司核心项目,由 CTO 田密负责,今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。此外,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。


MathGPT 与大语言模型(LLM)的差异


美国 OpenAI 公司在今年三月份发布了大语言模型 GPT-4,国内百度、阿里也发布了各自的大模型产品,但通用语言模型更像一个 “文科生”,在语言翻译、摘要、理解和生成等任务上有出色表现,在数学问题的解决、讲解、问答和推荐方面则存在明显不足:解答数学问题经常出错,有些数学问题虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配。


“这种不足是由 LLM 模型的自身特点决定的。” 学而思 AI 团队负责人介绍,LLM 大模型来自对海量语言文本的训练,因此最擅长语言处理。行业内偏向基于 LLM 大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。因此,学而思决心组建团队专研 MathGPT—— 数学领域大模型,用自己在数学和 AI 上的多年积累,面向全球范围内的数学爱好者和科研机构,做好 AI 大模型时代的数学基础工作。


学而思希望通过 MathGPT 弥补和攻克大语言模型的三个问题:第一,题目要解对,现在 GPT 结果经常出现错误;第二,解题步骤要稳定、清晰,现在 GPT 的解题步骤每次都不一样,而且生成内容经常很冗余;第三,解题要讲的有趣、个性化,现在 GPT 的解释过于 “学术” 和机械,对孩子的学习体验很不友好。


做 MathGPT,学而思凭什么


学而思作为获国家科技部批准的 “智慧教育国家新一代人工智能开放创新平台” 建设单位,也是教育行业唯一一家人工智能 “国家队” 成员,在人工智能领域有着多年的深入研究,早在 2017 年,学而思便成立了 AI lab 人工智能实验室。


据公开信息显示,基于智慧教育人工智能开放创新平台助力,学而思 AI lab 获得各类顶级学术会议比赛冠军 16 项,亚军 6 项;发表国际期刊和会议高水平学术论文 31 篇,包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究,在计算机视觉顶会以及自然语言顶会中均有多篇论文发表;申请专利 220 余项,授权专利 150 余项,软件著作权 60 余项。 


学而思 AI lab 在各类顶级学术会议比赛获奖情况


“以数学起家” 的学而思至今已有 20 年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行 MathGPT 训练的必备物料。另外,学而思的海外业务 Think Academy 在全球若干国家和地区深受数学爱好者喜欢,学而思的学生在每年的 IMO 和 AMC 等国际数学竞赛中表现优异,每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。所以,学而思选择在 MathGPT 方向发力也顺理成章。


另据了解,学而思学习机近期将会上线一款 “AI 助手”,涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该 AI 产品将于 5 月 11 日开启内测。


MathGPT 的挑战和技术难题


如何利用大语言模型服务各行各业是当下社会的焦点问题。比如在教育领域,Duolingo、Quizlet、可汗学院等产品主要和 OpenAI 合作,在 GPT 大模型上做微调和接口调用,增强原有的产品体验。但也有一些领域如数学、医学等,对 AI 的需求是准确、清晰、具备强大的逻辑推理能力,且容错率低,通用 LLM 目前的性能表现还无法在上述领域取得突破,未来是否可能取得突破尚不清晰。


以数学领域为例,目前市场上有几个主要流派。比如 Google 收购的 Photomath、微软数学、Mathway、专注数学计算的 WolframAlpha 等产品,主要利用非 LLM 的传统 AI 技术加上数据库的方式解决数学问题。走 AGI 路线的公司则尝试让通用 LLM “更懂数学”,比如 GPT4 在数学任务上比之前的 3.5 版本性能更好,谷歌旗下的 Minerva 模型也专门针对数学问题进行调优。学而思选择了另一条少有人走的路,不基于现有 LLM 做微调和接口调用、不做通用 LLM,而是自研基于专业领域的 “数学大模型” MathGPT,致力于打造自主、稳定、可持续、高质量的学习解决方案。


在大语言模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。学而思自研独立的 MathGPT 大模型是否成立,是否能够超越通用模型在数学任务上的表现,是否更匹配不同人群的数学学习场景,这个问题还需要在创新实践中寻找答案。随着整个行业的深化发展和越来越多人才参与到这个领域,相信不久的将来就能看到更为成熟的解决方案。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
周末乱吃, 增重1.2 磅学而思让我体会了一把“粮票”时代那不堪回首的经历……学而思开到美国后,很多家长悄悄下载了它,而且还全免费!解决通用LLM「偏科」问题,数学大模型MathGPT要来了!阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-OwlMathGPT来了!专攻数学大模型,解题讲题两手抓蛰伏与沉潜之后 · 云且留住轻松搞定英语学习最难点,新东方趣味语法漫画 & 四大名著少年版(含学而思大师精读课)听说学而思美国不教竞赛数学课了?第三届 冇(Mǎo)国际青年影像周 开始征片啦!学而思真是太讨厌了!又来骗我钱……吃旧瓜2022冬日增肌营毕业致辞马斯克官宣TruthGPT,正面硬刚ChatGPT“传统学校应该平静地死去”学而思要下场做中国GPT了,教育界革命要来了?复旦MOSS升级版开源上线;马斯克启动TruthGPT;海康训练出百亿参数CV大模型丨AIGC大事周报学而思名师让语文考题模板化,学完肉眼可见的进步了(明10点开团)香港中小学空余学位近9万;学而思计划推出MathGPT…一周资讯马斯克着手开发TruthGPT来最大限度寻找真相,以对抗ChatGPT|环球科学要闻比尔盖茨发微博称抵达北京,2019年后首度访华;盒马鲜生2022年销售额610亿元;学而思回应AI大模型侵权事件……本周好物一篇看完!暑假必备的家得路护眼专家,风靡全球的《千万不要玩穿越》,学而思学习机,69/2瓶优佳防晒~加拿大学而思一周年,2000名本地娃的选择,暑期课程大优惠!学而思名师让语文考题模板化,学完肉眼可见的进步了|开团今日财经 | OpenAI推出GPT-4;九安医疗称在硅谷银行存款已可使用;学而思紧急发布声明上周六,我参加了学而思发展大会,发现……学而思没凑首发,除了研究内容,我们做这件事能让效果翻倍早报|天津两处居民楼爆炸,致3死多伤;笑果回应旗下公司擅自演出被罚;小米回应或被印度没收48亿元;笔神作文炮轰学而思AI大模型海底捞要求必须点锅底;学而思调查素养课超纲培训;Meta宣布裁员10000人;华为手表将率先支持卫星通信...学而思重启大规模线下招生?还将超前、超纲内容纳入教学?公司回应了!学而思学习机正在直播中,速进!还有千元智能台灯免费送​腾讯会议4月4日起取消免费300人不限时会议;马斯克否认特斯拉与比亚迪暂停电池合作;​学而思声明将严格遵守“双减”要求……OpenAI CEO:巨型AI模型时代已结束,马斯克TruthGPT曝光直播预告丨学而思30w资源都放进学习机,真的适合你吗?开播啦!学而思名师支招语文学习保姆级计划,一站式解决课标全部难点赏画、评画
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。