Redian新闻
>
国际中文教育大模型“桃李” 1.0发布

国际中文教育大模型“桃李” 1.0发布

公众号新闻
随着ChatGPT引起全社会的关注,及各类大语言模型(Large Language Model)争相亮相,通用域自然语言处理任务已获得巨大成功,引起了国际中文教育领域的普遍关注。国际中文教育人士纷纷展开了对大模型的探讨:大模型是否可以根据学习者的水平,提供合适的语言表达,或根据学习者的问题给出详细的解答,从而在一定程度上辅助甚至充当学习伙伴、语言教师?然而,目前通用领域的大模型在垂直领域的效果仍有限。为解决上述问题,我们全面推出适用于国际中文教育领域的大模型“桃李”(Taoli)1.0,以期成为大模型在国际中文教育领域应用的引玉之砖。



“桃李”(Taoli)

· “桃李”在通用中文基座模型上扩充了国际中文教育领域专有词表,使用了该领域专有数据集进行指令精调,增强了大模型在该领域多项任务上的理解能力。
· “桃李”可以根据学习者的情况作出反馈,帮助学生模拟真实的语言交际场景。例如,与汉语水平等级为三级的学生对话时,能够控制其使用的语言尽量不超过三级的难度。
· “桃李”具有文本纠错功能,能够分别进行最小改动纠错与流利提升纠错,并能深入分析错误原因;具有作文评分功能,能够自动对作文水平进行评判,帮助学生自主学习。
· “桃李”能够方便国际中文教师整合教学资料,提供教学思路,提升教学质量。例如辅助生成教学过程中需要做的教案、幻灯片中需要展示的例句、课堂需要给学生提供的课外素材等。
“桃李”(Taoli)大模型: https://github.com/blcuicall/taoli



训练数据

我们基于目前国际中文教育领域流通的500余册国际中文教育教材与教辅书、汉语水平考试试题以及汉语学习者词典等,构建了国际中文教育资源库。我们设置了多种形式的指令来充分利用知识,构造了共计 88000 条的高质量国际中文教育问答数据集,数据示例如下:
"instruction": "修改句子的表达方式,使其更流畅、自然。",
"input": "我去中国的时候,我希望我要认识很多中国人。",
"output": "我去中国后,希望可以认识很多中国人。"



模型效果对比

1.考试能力
我们从教师与学习者两个方面出发,分别对几个模型在国际汉语教师资格证考试与汉语水平考试(HSK)上的表现进行了测评。其中HSK考试采用2018年官方出版的考试真题,从一级到六级各选择一套。国际汉语教师资格证考试采用2021年出版的官方真题。试题以客观题为主,主观题不参与计分。
以HSK4-6级为例:
试题(客观题)
Taoli 1.0
GPT-4
HSK4
55
78
HSK5
60
85
HSK6
42
76
2.样例展示
输入
Taoli 1.0
请遵循最小改动原则纠正下面这句话:北京与西安有很多好象一样的地方。北京和西安有很多类似的地方。
请生成词语在当前上下文中的释义。
词语:折服
上下文:我深深地被他的奉献精神所折服。
被说服或被感动
请使用下列所有词语,写一个30字左右的段落。
词语:元旦、放松、礼物、表演
元旦是一年中最重要的节日之一,人们会庆祝并享受放松的时间。在节日中,人们会收到礼物,表演,并享受各种活动。


合作单位
本项目由北京语言大学、清华大学、东北大学、北京交通大学合作完成。

总结与展望
通过对中文基座模型的指令微调,我们推出了国际中文教育大模型“桃李”(Taoli)1.0
“桃李”有助于提供个性化、智能化的汉语学习指导,有助于推动国际中文教育领域的智能化发展。在未来,我们将继续拓展其在语言教育领域的应用范围,为更多学习者带来智能化的教育场景体验。
多种高阶版本的“桃李”教育大模型正在研发中,敬请期待!

编辑:孔存良、朱君辉、常鸿翔




进NLP群—>加入NLP交流群

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
大模型刷新教育赛道,网易有道发布国内首个教育大模型“子曰”40位教育大咖畅聊未来教育,惠灵顿(中国)教育节太前沿了!大模型Prompt的中文教程来了!中国团队自动驾驶大模型斩获CVPR最佳论文;Stability AI推出新文生图模型;京东大模型即将发布丨AIGC大事日报金壮龙以视频方式出席第十八届中国国际中小企业博览会和第二届中小企业国际合作高峰论坛并致辞全新中文大模型多任务基准CMMLU:评估中文多任务语言理解能力美国历史上的奴隶制和对奴隶的赔偿百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报传OpenA正测试DALL·E 3模型;华为语音助手支持AI大模型;亚马逊组建AI大模型新团队丨AIGC大事日报世卫正式宣布阿斯巴甜可能致癌;中国AI大模型“监管办法”发布;网易知识公路宣布停止运营……10家机构入驻虹桥国际中央法务区;君合、竞天公诚、汇业、广和晋升/加盟多名合伙人;5家外所获准在华设立代表处 | 律所动态阅文发布首个网文行业大模型“阅文妙笔”,辅助网文创作、提效IP打造|甲子光年科大讯飞年营收188亿:将于5月6日发布认知大模型“星火”猛跌40%与连续涨停,中美教育大模型的“冰火两重天”真正的绿色|浙江大学建筑历史与遗产保护国际中心|DEEP GREEN有人问我:美国有什么好?“小巨人”挑大梁——第十八届中国国际中小企业博览会侧记中文医学大模型“本草”(原名华驼):医学知识增强在中文大型语言模型指令微调上的初步探索最新大模型排名!中文大模型评测基准SuperCLUE发布6月榜单上海发布大模型政策,打造AI“模”都;罗永浩“曲线上市”成功;华为云正式发布盘古大模型3.0……母亲节 | 星天娃中文教育祝天下所有母亲,节日快乐!海外纵横丨海外华校校长谈中文教育:差异化教学 多元化发展火星乐园第三部《灰界》第四章 重拳直击《大爱如歌》&《如梦令》大模型变“小”:黑马天启开创AI模型“重度垂直”新思路,入选北京大模型行业应用典型案例空船创业黑马发布科创大模型“黑马天启”,将面向产业做AIGC推广与服务平台大牌开仓!密西国际中心迎GUESS,G-Star, Diesel 春季大甩卖只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型活动 | 6.21 教育成本效益分析的历史与未来——中国学者对话著名教育经济学家亨利·M·莱文教授坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」语言模型如何拯救“桃子公主”?阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl比亚迪:预计上半年净利润超百亿;索尼与微软达成协议;携程发布首个旅游行业垂直大模型“携程问道”;腾讯客服回应微信号被回收...大模型的思想钢印:如何让ChatGPT相信水是有毒的?​中文信息处理实验室最新研究揭示虚假信息在大模型中的扩散机制
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。