MLNLP学术Talk第十九期 | 余海洋、黎槟华@阿里达摩院:基于知识的下一代对话:新任务、新数据、新榜单
MLNLP学术Talk是MLNLP社区举办的学术交流活动,旨在邀请一线青年学者分享最前沿的技术,期待最精彩的思想火花碰撞。
本期MLNLP学术Talk邀请了阿里达摩院余海洋、黎槟华为我们带来“基于知识的下一代对话:新任务、新数据、新榜单”的主题报告。详细信息如下:
报告一
个人介绍:
余海洋,阿里巴巴达摩院算法专家,研究领域包括深度学习、自然语言、预训练、文档问答等。在学术会议上参与发表论文10+篇,相关研究在Doc2Dial、WebQA等国际榜单上多次登顶。研究成果在阿里云智能客服、钉钉员工助理等产品中落地应用
报告摘要:
文档是各行业最普遍存在的非结构化数据知识,围绕文档的问答技术近年来取得了较大进展,受到了业界的广泛关注。本次报告将围绕文档问答的历史演进和我们的最新研究成果展开,并重点介绍我们举办的ACL2023 DialDoc Workshop Shared Task的新数据和新任务,该workshop由我们和Google Research、Amazon AI Labs、IBM Research AI、哥伦比亚大学、AllenAI等共同举办,设置 Best Paper Award 和 Best Student Paper Award并提供5万元的比赛奖金。
报告二
个人介绍:
黎槟华(临城),阿里巴巴达摩院Conversation AI团队算法专家,北京大学毕业,研究领域包括NLP、预训练、结构化问答等。在学术会议上发表论文20+篇,相关研究在Spider、CoSQL、SparC等国际榜单上多次登顶。研究成果在阿里云智能客服、阿里云QuickBI等产品中落地应用。
报告摘要:
表格及SQL类型的数据库是各行各业最广泛存在的结构化知识,近年来,围绕表格型知识的Text-to-SQL技术受到了学术界、工业级的广泛关注。当前的公开数据集和榜单极大推动了该方向的发展,但由于其表格知识相对简单并且多为虚拟构造,和真实工业场景有较大差距,迫切需要有面向大规模真实数据库的新一代数据集为后续发展提供基础。在本次报告中,首先会介绍Text-to-SQL的发展路径以及达摩院Conversation AI团队的最新研究成果,然后重点介绍我们构建的大规模新一代数据集BIRD,并发布比赛榜单。
特别鸣谢本次学术Talk的主要组织者:
MLNLP秘书处(王乐涵、段然、陈麒光、刘洪宇、魏福煊)
关于我们
微信扫码关注该文公众号作者