荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布
随着ChatGPT等技术的兴起,我们正在步入一个人工智能技术引领的全新时代。2023年,大语言模型、AIGC、世界模型、具身智能、超级智能体等关键词频繁地出现在各大新闻头条,人工智能不仅经历着范式转变,更被誉为第四次工业革命的标志性成就。在全球竞相发展新一代人工智能技术的时代背景下,2024年的《政府工作报告》强调了“人工智能+”战略的重要性,明确了人工智能在推动新质生产力发展中的关键作用。
什么是新一代人工智能?新一代人工智能将如何改变我们的生活?如何在这场技术革命中抢占先机?这些问题影响着人工智能的发展,更深刻地影响着国家的前途命运。多模态大模型,是这场技术范式变革的核心,是迈向通用人工智能(AGI)的关键。
多模态大模型涵盖了多种技术领域,包括自然语言处理、计算机视觉以及具身智能等。近年来,这些领域的研究成果不断涌现,但却分散在各个领域和不同的文献中。由于表述习惯、术语和符号的差异,初学者往往难以建立系统性的理解,面临一定的学习困难。由中山大学人机物智能融合实验室(HCP-Lab)刘阳副研究员和林倞教授精心编写的《多模态大模型:新一代人工智能技术范式》一书的出版恰逢其时,本书不仅涵盖了自然语言处理、计算机视觉和具身智能等多个领域,更是深入浅出地介绍了多模态大模型的关键技术和应用,全面且系统地介绍多模态大模型,为广大人工智能从业者和爱好者提供一本全面而系统的学习指南。
《多模态大模型:新一代人工智能技术范式》是业内首本全面介绍多模态大模型核心技术与应用的书籍,并围绕新一代人工智能技术范式,详细阐述了因果推理、世界模型、超级智能体与具身智能等前沿技术。
《多模态大模型:新一代人工智能技术范式》致力于全面而系统地介绍多模态大模型的关键技术、基础模型和典型应用。本书采用通俗易懂的语言和丰富的直观实例,深入浅出的方式介绍了各个关键技术点,旨在为初学者和人工智能领域的新进人才搭建一座通往深入理解的桥梁。本书不仅深入阐述了因果推理、世界模型、具身智能与多智能体等前沿技术,还详细探讨了丰富的应用场景。
本书还荣幸得到了鹏城实验室主任、中国工程院高文院士的作序力荐。高文院士认为,本书的出版有助于人工智能科研工作者全面了解多模态大模型的特点及潜在发展方向,对新一代人工智能技术范式和AGI的发展起到重要推动作用。《多模态大模型:新一代人工智能技术范式》不仅是一本技术指南,更是一份行动路线图,旨在为学术界和工业界提供一个清晰的视角,以促进人工智能科研工作者更全面地了解多模态大模型的技术和新一代人工智能的发展方向。
本书架构
本书内容共五章,每一章都围绕着多模态大模型的关键领域展开。第一章从最具代表性的大模型结构入手,引导读者深入了解当前主流大模型,为对多模态大模型的全面认知打下基础。第二章深入剖析了多模态大模型的核心技术,涵盖了预训练、提示学习、上下文学习、微调、思维链和人类反馈强化学习,揭示了多模态大模型的独特之处和技术内涵。第三章介绍了多个代表性的多模态基础模型,如CLIP、BLIP、LLaMA、SAM和PaLM-E等,展示了技术的多样性和广泛性。第四章通过视觉问答、AIGC和具身智能这三个典型应用展示了多模态大模型的实际应用能力。最后,第五章探讨了现有多模态大模型存在的挑战,并介绍了实现通用人工智能的可行思路。
本书主要面向高年级本科生和研究生,可以作为新一代人工智能相关课程教材使用,也可以作为对多模态大模型感兴趣的读者入门之用。
本书主要内容
中山大学人机物智能融合实验室(https://www.sysu-hcp.net)由林倞教授创办于2010年,实验室围绕“人工智能前沿技术与产业化”布局研究方向与课题,并深入应用场景打造产品原型,输出大量原创技术及孵化创业团队,许多重要学术和产业成果享誉全球。
在多模态认知计算、具身交互与学习、元宇宙与数字人、可控内容生成等领域开展体系化研究,以“攀学术高峰、踏应用实地”为工作理念。2022年实验室孵化创新企业拓元智慧,打造通用多模态认知AI技术平台,深度赋能企业数智化、元宇宙、智慧城市等主要应用场景。
作者简介
立即获取,开启智慧之旅
《多模态大模型》不仅是高年级本科生和研究生的理想教材,也是对多模态大模型感兴趣的读者的宝贵资源。本书在线资源(含目录、参考文献等)已经上线:https://hcplab-sysu.github.io/Book-of-MLM/
现在就访问京东官方自营购买本书,开启您的人工智能学习之旅!
京东官方自营购买链接:https://item.jd.com/10100489294930.html
更多内容,点击下方关注:
微信扫码关注该文公众号作者