Redian新闻
>
大模型综述出书了

大模型综述出书了

公众号新闻


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。
转载自 | RUC AI Box

在2023年3月,我们发表了大语言模型综述文章《A Survey of Large Language Models》。这篇综述文章已经更新到第13个版本,包含了83页的正文内容,并收录了900余篇参考文献。该综述文章旨在系统地梳理大语言模型的研究进展与核心技术,讨论了大量的相关工作。自大语言模型综述的预印本上线以来,受到了不少读者的关注。



自英文综述文章上线后,陆续有读者询问是否有对应的中文版本。为此,我们于2023年8月发布了该综述的中文翻译版。为了更好地提供大模型技术的中文参考资料,我们于2023年12月底继续启动了中文书的编写工作,并且于近日完成初稿。与英文综述文章的定位不同,中文版书籍更注重为大模型技术的入门读者提供讲解,为此我们在内容上进行了大幅度的更新与重组,力图展现一个整体的大模型技术框架和路线图。本书适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的参考资料。


中文书项目链接:

https://llmbook-zh.github.io/



中文书下载链接1:

https://github.com/LLMBook-zh/LLMBook-zh.github.io/blob/main/LLMBook.pdf

中文书下载链接2:

http://aibox.ruc.edu.cn/zws/index.htm


全书章节组织:

一、背景与基础知识

第一章  引言(大模型发展历程、重要技术概览)

第二章  基础介绍(Scaling Law、GPT系列模型发展历程)

第三章  大模型资源(开源模型、数据、代码库)

二、预训练

第四章  数据准备(数据收集、清洗、配比、课程方法)

第五章  模型架构(Transformer 结构、大模型主流架构、细节改进)

第六章  模型预训练(预训练任务、优化参数设置、并行训练方法)

三、微调与对齐

第七章  指令微调(指令数据收集与合成方法、指令微调策略与作用)

第八章  人类对齐(3H标准、RLHF算法、非RL算法)

四、大模型使用

第九章  解码与部署(解码生成算法、解码加速算法、模型压缩算法)

第十章  提示学习(基础提示方法、上下文学习、思维链)

第十一章  规划与智能体(复杂规划方法、智能体搭建方法)

五、评测与应用

第十二章 评测(评测指标与方法、基础与高级能力评测、评测体系)

第十三章 应用(概览研究领域与专业领域的应用)



大语言模型发展时间线



LLaMA 系列模型的衍生工作进化图


在本书撰写过程中,我们收到了来自许多同行的大量修改意见,在此一并表示感谢,希望大家一如既往支持与关注我们的大模型中文书,您的支持与反馈将是我们前行最大的动力。本书的初版仅是一个起点,我们计划在网上持续进行内容的更新和完善,并特别欢迎读者提出宝贵的批评与建议,也会同步在网站上对于提出宝贵建议的读者进行致谢。如果您有任何意见、评论以及建议,请通过GitHub的Issue页面(https://github.com/LLMBook-zh/LLMBook-zh.github.io/issues邮箱进行反馈。

为了更好地整理和传播大模型技术的最新进展与技术体系,我们为读者提供了以下配套资源,供读者在阅读本书时进行参考和使用。


大模型代码工具库:我们开发了一个全面的代码工具库LLMBox,专门用于开发和实现大语言模型,其基于统一化的训练流程和全面的模型评估框架。LLMBox旨在成为训练和利用大语言模型的一站式解决方案,其内部集成了大量实用的功能,实现了训练和利用阶段高度的灵活性和效率。工具库链接:https://github.com/RUCAIBox/LLMBox



YuLan大模型:YuLan系列模型是中国人民大学高瓴人工智能学院师生共同开发的支持聊天的大语言模型(名字“玉兰”取自中国人民大学校花)。最新版本从头完成了整个预训练过程,并采用课程学习技术基于中英文双语数据进行有监督微调,包括高质量指令和人类偏好数据。模型链接:https://github.com/RUC-GSAI/YuLan-Chat



本书各章节的主要负责人和参与人名单如下:

  • 第三章的负责人是闵映乾和杨晨,参与人有李军毅、周昆;

  • 第四章的负责人是张君杰、侯宇蓬和周昆;

  • 第五章的负责人是董梓灿,参与人有田震和唐天一;

  • 第六章的负责人是唐天一和陈昱硕;

  • 第七章的负责人是唐天一,参与人有成晓雪;

  • 第八章的负责人是李军毅和陈志朋;

  • 第九章的负责人是陈昱硕、刘沛羽和唐天一,参与人有周昆;

  • 第十章的负责人是李军毅、汤昕宇和都一凡;

  • 第十一章的负责人是任瑞阳和蒋锦昊,参与人有李军毅;

  • 第十二章的负责人是张北辰和周昆,参与人有张高玮;

  • 第十三章的负责人是周昆,参与人(按拼音字母排序)有蒋锦昊、李依凡、刘子康、孙文奇、王禹淏、徐澜玲、杨锦霞和郑博文。

同时感谢其他所有参与本书编写、校对的同学和老师们。


关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
SuperBench大模型综合能力评测报告伦敦墙西地块改造成大型综合体,又一座地标建筑360安全大模型3.0来了!垂直大模型,他们这么训今日arXiv最热NLP大模型论文:微软:用大模型分析用户满意度,让智能系统更善解人意大模型如何用因果性?最新《大型语言模型与因果推断在协作中的应用》全面综述东京自由行(7)神舍和寺庙今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理长篇小说《太门西》连载70:第24章:柳毅龙井(1)万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化今日arXiv最热NLP大模型论文:CMU最新综述:工具使用,大模型的神兵利器大模型如何用于游戏?游戏玩家代理与大模型综述:方法、应用与挑战AI早知道|360安全大模型3.0发布;通义听悟上线音视频问答助手;腾讯混元大模型参数规模扩展至万亿情人节的玫瑰246篇文献!参数高效微调最新综述发布,让大模型不再「巨无霸」破解大模型安全难题,360推出大模型安全能力框架AI早知道|马斯克Grok大模型开源;荣耀正式发布首款AI PC;苹果谷歌和OpenAI商谈iPhone大模型使用北京9岁小学生,已经用AI出书了!罗永浩围观:有事找不到我找AI宾州南瓜节,花样百出AI早知道|商汤发布日日新5.0大模型;微软推出小语言模型Phi-3;腾讯旗下协作SaaS产品全面接入混元大模型LLM综述出书了!人大高瓴赵鑫老师组发布全新大语言模型中文书让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事春招丨中核资本本部2024年校园招聘正式启动!12类岗位任你选择,大型综合国企,七险二金,十几类休假+各种补贴陶大程团队联合港大等发布最新综述:374篇文献全面解析大模型知识蒸馏今日arXiv最热NLP大模型论文:大模型RAG新宠!浙江大学发布自反馈检索增强方法开源大模型火了!(附99个大模型微调模型/数据/工具)!清华大学:superBench大模型综合能力评测报告(2024年3月)春招丨中核集团2025届春招提前批开启!全国有岗,大型综合国企,七险二金,十几类休假+各种补贴清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!北京9岁小学生,已经用AI正式出书了!未来不是人和人竞争了!今日arXiv最热大模型论文:清华把大模型用于城市规划,回龙观和大红门地区成研究对象驴象早春战犹酣今日arXiv最热NLP大模型论文:华东师大发布对话级大模型幻觉评价基准DiaHalu北京内推 | 微软亚洲研究院WWE大模型团队招聘大模型研究实习生今日arXiv最热NLP大模型论文:天津大学发布大模型数学能力细粒度评价基准FineMath
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。