复旦大学NLP实验室《自然语言处理导论》 网络初版发布
来自:FudanNLP
进NLP群—>加入NLP交流群
最近 ChatGPT 大火,这个风靡全网的 AI 应用的各项能力是从何而来,它是如何演化至今的,未来又将走向何方?ChatGPT是通往通用人工智能的未来吗?还是像Yann LeCun说的那样,大模型解决不了自然语言处理的全部问题?
这些问题的解答,涉及到自然语言处理、机器学习以及人工智能等多方面的知识。虽然通过阅读论文可以了解相关研究工作,但由于自然语言处理涉及的知识广博繁杂,发展日新月异,对于基础知识和研究方向的把握还需要系统学习。因此一部系统全面,且经过有效筛选和沉淀的教材仍然是不可或缺的。
复旦大学自然语言处理实验室张奇教授、桂韬研究员以及黄萱菁教授从2020年起着手教材的规划,结合自己对相关领域的核心问题的理解,和长期教学、研究以及工程实践经验,系统梳理了自然语言处理领域发展至今的关键知识,历时近三年,终于在近期完成了初版。
同时本书也在2022年入选复旦大学七大系列百本精品教材项目和复旦大学研究生规划系列教材项目。
点击 阅读原文 或访问 https://intro-nlp.github.io/ 获取本书全文
chatGPT实现过程参看本书第6.5节
条分缕析,梳理 NLP 知识体系
《自然语言处理导论》主要面向高年级本科生和研究生作为自然语言处理相关课程教材使用,也适合对自然语言处理感兴趣的读者入门之用。
全书试图系统介绍自然语言处理的基本任务和主要处理算法,让读者认识不同任务的特性和算法设计的主要目标,并且建立起自然语言处理任务和机器学习算法之间的联系——了解如何将自然语言处理任务转化为机器学习问题,选择合适的机器学习算法,根据任务特性设计机器学习算法。
全书内容包含基础技术、核心技术以及模型分析三个部分。
基础技术部分介绍自然语言处理的基础任务和底层技术,包含词汇处理、句法分析、语义分析、篇章分析和语言模型。核心技术部分为自然语言处理应用任务和相关技术的介绍,包括信息抽取、机器翻译、情感分析、文本摘要、知识图谱等。模型分析部分重点关注基于机器学习的自然语言处理模型的鲁棒性和可解释性问题,是近来人工智能领域的研究重点。
“其作始也简,其将毕也必巨。”---自然语言处理的研究内容广博繁杂,融语言学、计算机科学、数学等学科为一体;从上世纪50年代到今天,其研究范式也经过了多次更迭,更与机器学习研究之间有着非常紧密的联系,这为《自然语言处理导论》的写作带来了很大的困难。
张奇教授、桂韬研究员以及黄萱菁教授在工作繁忙之余花费大量时间对本书的结构进行了精心设计。对于每个自然语言处理任务,本书从任务目标、相关语言学理论知识、不同研究范式对应的不同算法(包括基于规则的方法、基于特征的机器学习方法、基于深度神经网络的算法)、任务评测指标和常见数据集这几个方面展开介绍;并且适时说明各类机器学习算法适用的自然语言处理任务类型,让读者更有效、深刻地理解和掌握书中内容。
It's Just the Beginning
虽然 ChatGPT 多才多艺,但在使用过程中也显示出各种各样的问题。也许像比尔·盖茨说的,这种技术的出现有着重大的历史意义,但也仅仅刚刚起步。本书的网络公开版发布,也仅仅是一个开始。一部好的教科书,也需要作者的长期投入,不断的推敲和打磨,功不唐捐,玉汝于成。非常欢迎大家对本书提出宝贵建议。
如果你对人工智能、自然语言处理感兴趣,不妨打开链接,和我们一起探索NLP的无限可能吧!
▼点击"阅读原文"获取论文原文。
微信扫码关注该文公众号作者