直播预告 | 清华大学深研院马仕镕:电商领域指令微调大模型
报告介绍
大语言模型在通用领域的自然语言处理任务中有出色的表现,然而电商数据的独有特点给通用大语言模型带来了重大挑战,比如结构相比普通文本更复杂,独有的实体或概念较多。为了提高大语言模型在电商任务上的表现,我们构建了首个电商指令数据集EcomInstruct,并基于此训练了电商大模型EcomGPT。得益于EcomInstruct中丰富的“任务链”任务,EcomGPT在下游的电商任务上表现出了良好的泛化能力。
马仕镕
清华大学深圳国际研究生院硕士生
马仕镕,清华大学深圳国际研究生院知识工程实验室三年级硕士生,阿里巴巴达摩院暑期实习生。主要研究方向为NLP,具体包括文本纠错、文本生成等,在EMNLP、ICASSP等NLP相关会议上发表若干篇文章,在CCL等国际和国内NLP算法竞赛上多次获奖。
扫码下方二维码
进入直播间观看
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章