大模型刷新教育赛道，网易有道发布国内首个教育大模型“子曰”

2023-07-28 18:07

作者 | 凌敏

7 月 26 日，教育科技公司网易有道在“powered by 子曰”教育大模型应用成果发布会上，推出了国内首个教育领域垂直大模型“子曰”，并发布了基于“子曰”大模型研发的六大创新应用——“LLM 翻译”、“虚拟人口语教练”、“AI 作文指导”、“语法精讲”、“AI Box”以及“文档问答”。

网易有道 CEO 周枫表示：“一个好的技术有没有价值、能不能发挥巨大的作用，很多时候关键在场景和应用的选择以及细节的打磨。通过软件、硬件、AI 技术的结合，做出精品是我们现在做的事”。

1 有道发布教育大模型“子曰”，六大创新应用成果正式落地

大模型的出现能给教育带来的最大机会是什么？

周枫在发布会上表示：“我认为，是助力因材施教”。据介绍，之所以叫‘子曰’，是因为孔子是我国的教育先贤，又是因材施教教育理念的奠基者。‘夫子教人，各因其材’，我们希望子曰大模型可以朝着这样的教育理想去做。”

周枫向在场观众分享了大模型“因材施教”的三大优势。首先，大模型能为学生提供个性化的分析和指导；其次，大模型能够实现引导式学习，与教师一样，提出问题并引导学生自行探索答案；最后，大模型具备全科知识整合能力。通过连接多模态知识库、跨学科整合知识内容，大模型能随时满足学生的动态需求，帮助孩子培养更综合的能力。

相比于通用大模型，“子曰”大模型从一开始就定位为是一个“场景为先”的教育垂类大模型。它能够作为基座模型支持诸多下游任务，向所有下游场景提供语义理解、知识表达等基础能力。基于此，有道研发团队在“子曰”大模型的基础上，为不同学习场景设计了定制化的模型，以实现模型与场景的高度契合。

“我们的目标很明确，就是以实际的教育场景驱动，用技术创新助力教育创新。”周枫表示，希望技术和产品的深度融合，可以根据学⽣不同能⼒和需求，提供因人而异的个性化教学。

在发布会上，网易有道展示了“子曰”大模型在多个场景中的应用成果，包括“LLM 翻译”、“虚拟人口语教练”、“AI 作文指导”、“语法精讲”、“AI Box”以及“文档问答”。

其中，最为瞩目的是大模型时代的英语口语练习神器——虚拟人口语教练 Hi Echo。发布会现场，有道词典业务负责人与 Echo 进行了多组随机对话。Echo 能迅速理解场景和上下文，并给出迅速反馈，发音也很地道，重音、弱读、升降调等细节处理得非常到位。在对话过程中，Echo 能够像真人老师一样循循善诱，启发式进行对话引导，还能进行实时反馈。对话结束后，Echo 会从发音、语法等维度给予建议和润色，能有效解决长期困扰英语口语学习者无话可说、不知从何说起、害怕说错等问题。

“中国人在说英语时往往面临开口难、不敢说、不知道该从何说起的困境，其中的关键就在于缺乏语言环境。” 有道词典业务负责人表示，Echo 恰恰能为用户带来这种真正贴合实际的“语境”，帮助他们更好地练习英语口语。

此外，“子曰”大模型还覆盖了多种学习场景。例如，在写英语作业时，学生们不仅有解决具体问题的需求，还需要学会举一反三。“子曰”大模型赋能的“语法精讲”功能可以为学生提供针对性的解题思路和方法，还能推荐同类型的考题，帮助学生触类旁通，真正理解考纲中的考点。

“AI 作文指导”应用不仅具备“作文批改”功能，还具备“作文指导”功能。据介绍，该应用旨在解决“学生不会写”和“老师没时间改”的问题。针对学生在写作、前、中后过程中面临的题目主旨难确定、写作素材匮乏等难题，该应用都能够给予指导，帮助学生“下笔如有神”。批改环节中，AI 作文指导还会从表达、结构、内容深度、情感丰富度四大维度全面提供改进建议。

2 场景拉动，“AI+ 教育”技术沉淀与创新

会上，周枫多次强调“场景拉动”的重要性。他表示，“子曰”大模型在教育行业的应用，不仅可以帮助学生更好地学习，也可以帮助老师更好地教学，借此实现因材施教的教育理想。

通过深入调研和分析用户在不同场景下的需求，网易有道成功利用大模型的力量，在教育领域打造了诸如虚拟人口语教练、语法精讲、AI 写作指导等丰富的解决方案。这一策略不仅体现了网易有道对教育场景的深入理解，还为用户提供了更加个性化和高效的学习体验。

早在 2008 年，有道就推出自主研发的国内首家统计机器翻译线上引擎。经过 15 年技术迭代，有道神经网络翻译（NMT）已经进化成行业领先的“最强大脑”。根据 QUESTMOBILE 最新数据，到目前有道词典月活用户已经超过 1 亿，是国内词典翻译市场的第一名。

从 2016 年开始，有道协同构建 AI 基础能力，同步组建语言、视觉、声音等团队，目前积累了有道神经网络翻译（NMT）、计算机视觉、智能语音 AI 技术、高性能计算 (HPC）四大底层技术能力。

自 2017 年，有道就与主流技术 Transformer“双向奔赴”，将 AI 能力统一在大模型之下，并尤其重视在端侧的落地应用。有道词典笔 2 代 2019 年首次搭载离线 Transformer NMT。2022 年，有道词典笔 P5 中搭载了自研的离线 ASR，也已升级为 Transformer 技术。技术的持续赋能奠定了有道学习硬件在行业内的领先地位。

底层技术不断革新的同时，有道还在不断研发细分场景下的“黑科技”。如虚拟人口语教练实现语音识别能力、虚拟人驱动技术和内容生成和对话能力等多项技术能力的突破。例如，虚拟人口语教练在语音识别能力方面进行了巨大的革新，它支持多语种的流式低延迟语音识别技术，让 Echo 在中式英语、英语、中英混合等场景下游刃有余；声学降噪、回声消除、自动语音检测、自动断句等技术，则让它像一个真正的倾听者和交流者，不仅能判断用户说话的起始，还能让用户随时打断，智能触发后续流程。

在 AI 虚拟人的驱动方面，有道基于自主研发的情感识别算法和实时渲染驱动引擎，对播放的语音数据进行深度分析，实时驱动虚拟人的面部表情和语音同步的口型变化，使虚拟人能够贴近真人，以更加自然和生动的方式与用户一对一交互，从而显著提升对话的真实感和用户体验。

点击底部阅读原文访问 InfoQ 官网，获取更多精彩内容！

第一批因AIGC裁掉自家员工的老板该后悔了？

C# 和 TypeScript 之父亲自带队开源 TypeChat，又一 AI 技术瓶颈被攻破？

终于找到 ChatGPT “智商”下降的原因了！OpenAI 侧面回应，GPT 可能真被你们玩坏了？

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章