中国中文信息学会《前沿技术讲习班》- 大模型系列专题 · 深圳站

2023-06-22 00:06

讲习班介绍

为进一步普及最新大模型前沿动态，推动国内大模型技术发展，发展基础理论与应用，中国中文信息学会《前沿技术讲习班》（CIPSATT）将推出大模型系列专题，首期将于2023年6月30日-7月2日在深圳线下举办。讲习班以大模型为主题，邀请了来自国内研究第一线的知名青年专家学者，系统讲述大规模预训练语言模型的基础知识、面临挑战和应用场景，为感兴趣的学者、学生和工程师提供系统学习和交流的机会，快速了解大模型前沿方向的基本概念、研究内容和发展趋势。

大模型系列讲习班预告

北京站 - 8月
济南站 - 9月
昆明站 - 10月
合肥站 - 11月

哈尔滨站 - 12月

讲习班信息

时间：2023年6月30日-7月2日

地点：中国科学院深圳先进技术研究院A504

地址：广东省深圳市南山区学苑大道1068号

注册参会：http://reg.cipsc.org.cn/cipsatt36/index.html

日程安排

本次讲习班内容涵盖大模型的多个方面，包括八大主题：

主题1：从NLP技术到LLM技术

主题2：从零构建大规模预训练语言模型

主题3：垂直领域大模型构建

主题4：大模型微调技术

主题5：大模型价值对齐

主题6：大模型评测方法

主题7：多模态大模型构建

主题8：大模型产业应用

详细日程安排

特邀讲者

/ 中国人民大学 /

赵鑫教授

讲者简介：赵鑫，现为中国人民大学高瓴人工智能学院教授。2014年7月于北京大学获得博士学位，随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理，共计发表论文100余篇，谷歌学术引用1万余次，曾主导研发了伯乐（推荐系统库RecBole）、妙笔（文本生成库TextBox）等开源工具。荣获2020年吴文俊人工智能优秀青年奖、ECIR 2021时间检验奖（Test of Time Award）、RecSys 2022最佳学生论文提名（Best student paper runner-up）、CIKM 2022最佳资源论文提名（Best resource paper runnerup）等，入选中国科协青年人才托举工程、北京智源青年科学家、CCF-IEEE CS青年科学家。

/ 香港中文大学（深圳）/

王本友助理教授

讲者简介：王本友，香港中文大学（深圳）数据科学学院助理教授和医疗健康信息研究中心副主任、深圳市大数据研究院兼职研究科学家。2022年在意大利帕多瓦大学获得博士学位，曾经在腾讯和华为诺亚方舟实验室工作或实习过。主要研究方向为自然语言处理（NLP）、应用机器学习、和信息检索。迄今为止，他曾获得了SIGIR 2017最佳论文提名奖、NAACL 2019最佳可解释NLP论文、NLPCC 2022最佳论文、华为火花奖和欧盟玛丽居里奖学金；主要研究工作发表在ICLR和NuerIPS，长期担任ICLR、NeurIPS、ICML、ACL、EMNLP审稿人。共发表了包括国际顶级会议20余篇，撰写的《推荐系统与深度学习》由清华大学出版社出版。曾在丹麦哥本哈根大学、加拿大蒙特利尔大学、荷兰阿姆斯特丹大学、华为诺亚方舟实验室、中科院理论物理所、社科院语言所交流访问。其团队开发的大模型包括多语言大模型凤凰（支持中文）、英文大模型Chimera以及医疗健康垂直领域大模型华佗GPT。

/ IDEA研究院 /

王瑞

讲者介绍：王瑞，哈尔滨工业大学（深圳）硕士毕业，曾就职于华为技术有限公司，现任IDEA研究院认知计算与自然语言研究中心（CCNL），大模型有监督指令微调团队算法负责人，也是开源“姜子牙”系列大模型SFT阶段的负责人。

/ 哈尔滨工业大学（深圳）/

李晶教授

讲者简介：李晶，哈尔滨工业大学（深圳）计算机科学与技术学院教授，博士生导师，国家优青基金（海外）获得者。分别于2010年、2013年在电子科技大学取得学士和硕士学位，2018年于新加坡南洋理工大学取得博士学位。2018年至2019年，在新加坡南洋理工大学担任博士后；2019到2023年，在阿联酋起源人工智能研究院任研究科学家。其主要研究方向为自然语言处理、信息检索、大模型高效微调与大模型安全等，具体领域包括：信息抽取与知识获取、知识图谱、迁移学习、元学习等。近年来在IEEE TKDE, SIGIR, WWW, ACL, ICDE, AAAI, IJCAI等国际重要学术会议和期刊发表论文近40多篇，合编专著1部《人工智能：知识图谱前沿技术》，常年担任多个国际会议程序委员会成员和期刊的审稿人。研究成果被应用于新加坡和阿联酋多个国家级项目。

/ 天津大学 /

熊德意教授

讲者简介：熊德意，天津大学智能与计算学部教授、博士生导师，自然语言处理实验室负责人，天津市“一带一路”联合实验室语言智能与技术中外联合研究中心主任。主要研究方向为自然语言处理，特别专注于机器翻译、自然语言对话、大语言模型、常识推理、认知计算等方向的研究。在Computational Linguistics、IEEE TPAMI、AI、AAAI、ACL等国际著名期刊和会议上发表论文150余篇，出版中英文专著各一部。获得国家自然科学基金优秀青年科学基金、国家重点研发计划“政府间国际科技合作创新合作”重点专项、英国皇家学会牛顿高级学者基金、工信部人工智能产业创新任务揭榜挂帅、云南省科技厅重点研发计划等项目资助。获得新加坡资讯通信研究院2008年年度研究贡献奖、北京市科学技术奖二等奖、中文信息学会中文信息处理科学技术奖青年创新奖一等奖等奖项。担任IALP 2012&2021程序委员会共同主席，CWMT 2017程序委员会共同主席，NeurIPS、ACL、EMNLP、NAACL、COLING、AACL等多个知名国际会议的领域主席、赞助主席、演示主席等，以及TACL和ARR的Action Editor等。领导研制了仁文伏羲大模型，与华为、阿里、字节跳动、OPPO等多家知名企业开展了深入合作。

/ 上海交通大学 /

何俊贤助理教授

讲者简介：何俊贤，上海交通大学John Hopcroft Center助理教授。2022年于卡内基梅隆大学计算机科学学院获得博士学位。研究关注语言模型、文本生成、深度生成模型等。担任ACL和EMNLP的领域主席。论文入选ACL 2019最佳系统论文提名、ICLR 2022最有影响力论文之一。曾获百度博士奖学金、AI华人新星百强等荣誉。

/ 微软亚洲研究院 /

吴晨飞高级研究员

讲者简介：吴晨飞博士，微软亚洲研究院高级研究员。研究方向为大模型预训练、多模态理解和生成。主要研究工作包括多模态生成模型NUWA（女娲）系列（NUWA, NUWA-LIP, NUWA-Infinity, NUWA-3D, NUWA-XL）、多模态理解模型Bridge Tower（桥塔）系列（KD-VLP, Bridge-Tower, Manager-Tower）以及多模态对话系统（TaskMatrix.AI）。在CVPR, NeurIPS, ACL, ECCV, AAAI, MM等会发表多篇论文。

/ 微软亚洲研究院 /

刘树杰高级研究员

讲者简介：刘树杰微软亚洲研究院高级研究员和研究经理，2012年博士毕业于哈尔滨工业大学。2012年加入微软亚洲研究院，从事自然语言处理、语音处理以及机器学习相关工作。在自然语言处理和语音处理各顶级期刊和会议上发表论文100余篇，并合著《机器翻译》一书，参与编写《人工智能导论》一书。获得国际自然语言和语音处理评测比赛多项第一。担任多个国际会议审稿人及领域主席。其研究成果被广泛应用于Microsoft Translator、Skype Translator、Microsoft IME和微软语音服务等微软重要产品中。

/ 腾讯AI Lab /

焦文祥高级研究员

讲者简介：焦文祥，腾讯AI Lab高级研究员，香港中文大学博士，师从金国庆教授与吕荣聪教授；本科和硕士就读于南京大学。研究方向：神经机器翻译、多语言机器翻译和通用大模型翻译，相关研究工作发表于ACL、EMNLP、TASLP等国际顶级会议和期刊。曾参加2022年WMT国际顶级翻译评测比赛，并夺得“大规模非洲多语言翻译任务（受限制赛道）”第一名。研究工作“Adapters for Enhanced Modeling of Multilingual Knowledge and Text”被2022年EMNLP多语言表示学习研讨会授予“最佳论文奖”。

/ 同济大学 /

王昊奋特聘研究员

个人简介：王昊奋，同济大学百人计划，特聘研究员，博士生导师。研究方向包括知识图谱、自然语言处理、对话问答机器人等。长期在一线人工智能公司担任CTO之职。他是全球最大的中文开放知识图谱联盟OpenKG发起人之一。他负责主持多项国家级和上海市AI相关项目，发表100余篇AI领域高水平论文，被引用次数达到2900余次，H-index达到26。他构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”；所构建的智能客服机器人已累计服务用户超过10亿人次。目前，他担任中国计算机学会术语工委副主任，SIGKG主席，上海秘书长，中国中文信息学会理事，语言与知识计算专委会副秘书长，上海市计算机学会自然语言处理专委会副主任，上海交通大学AI校友会秘书长等社会职位。