Redian新闻
>
荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布

荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布

公众号新闻

随着ChatGPT等技术的兴起,我们正在步入一个人工智能技术引领的全新时代。2023年,大语言模型、AIGC、世界模型、具身智能、超级智能体等关键词频繁地出现在各大新闻头条,人工智能不仅经历着范式转变,更被誉为第四次工业革命的标志性成就。在全球竞相发展新一代人工智能技术的时代背景下,2024年的《政府工作报告》强调了“人工智能+”战略的重要性,明确了人工智能在推动新质生产力发展中的关键作用。

什么是新一代人工智能?新一代人工智能将如何改变我们的生活?如何在这场技术革命中抢占先机?这些问题影响着人工智能的发展,更深刻地影响着国家的前途命运。多模态大模型,是这场技术范式变革的核心,是迈向通用人工智能(AGI)的关键。



1

新一代人工智能的探索之旅

多模态大模型涵盖了多种技术领域,包括自然语言处理、计算机视觉以及具身智能等。近年来,这些领域的研究成果不断涌现,但却分散在各个领域和不同的文献中。由于表述习惯、术语和符号的差异,初学者往往难以建立系统性的理解,面临一定的学习困难。由中山大学人机物智能融合实验室(HCP-Lab)刘阳副研究员和林倞教授精心编写的《多模态大模型:新一代人工智能技术范式》一书的出版恰逢其时,本书不仅涵盖了自然语言处理、计算机视觉和具身智能等多个领域,更是深入浅出地介绍了多模态大模型的关键技术和应用,全面且系统地介绍多模态大模型,为广大人工智能从业者和爱好者提供一本全面而系统的学习指南。

《多模态大模型:新一代人工智能技术范式》



2

权威推荐,内容丰富

《多模态大模型:新一代人工智能技术范式》是业内首本全面介绍多模态大模型核心技术与应用的书籍,并围绕新一代人工智能技术范式,详细阐述了因果推理、世界模型、超级智能体与具身智能等前沿技术。

《多模态大模型:新一代人工智能技术范式》致力于全面而系统地介绍多模态大模型的关键技术、基础模型和典型应用。本书采用通俗易懂的语言和丰富的直观实例,深入浅出的方式介绍了各个关键技术点,旨在为初学者和人工智能领域的新进人才搭建一座通往深入理解的桥梁。本书不仅深入阐述了因果推理、世界模型、具身智能与多智能体等前沿技术,还详细探讨了丰富的应用场景。

本书还荣幸得到了鹏城实验室主任、中国工程院高文院士的作序力荐。高文院士认为,本书的出版有助于人工智能科研工作者全面了解多模态大模型的特点及潜在发展方向,对新一代人工智能技术范式和AGI的发展起到重要推动作用。《多模态大模型:新一代人工智能技术范式》不仅是一本技术指南,更是一份行动路线图,旨在为学术界和工业界提供一个清晰的视角,以促进人工智能科研工作者更全面地了解多模态大模型的技术和新一代人工智能的发展方向。

高文院士作序力荐



3

系统架构,循序渐进

本书架构

本书内容共五章,每一章都围绕着多模态大模型的关键领域展开。第一章从最具代表性的大模型结构入手,引导读者深入了解当前主流大模型,为对多模态大模型的全面认知打下基础。第二章深入剖析了多模态大模型的核心技术,涵盖了预训练、提示学习、上下文学习、微调、思维链和人类反馈强化学习,揭示了多模态大模型的独特之处和技术内涵。第三章介绍了多个代表性的多模态基础模型,如CLIP、BLIP、LLaMA、SAM和PaLM-E等,展示了技术的多样性和广泛性。第四章通过视觉问答、AIGC和具身智能这三个典型应用展示了多模态大模型的实际应用能力。最后,第五章探讨了现有多模态大模型存在的挑战,并介绍了实现通用人工智能的可行思路。

本书主要面向高年级本科生和研究生,可以作为新一代人工智能相关课程教材使用,也可以作为对多模态大模型感兴趣的读者入门之用。

本书主要内容



4

实践导向,引领未来

中山大学人机物智能融合实验室(https://www.sysu-hcp.net)由林倞教授创办于2010年,实验室围绕“人工智能前沿技术与产业化”布局研究方向与课题,并深入应用场景打造产品原型,输出大量原创技术及孵化创业团队,许多重要学术和产业成果享誉全球。

在多模态认知计算、具身交互与学习、元宇宙与数字人、可控内容生成等领域开展体系化研究,以“攀学术高峰、踏应用实地”为工作理念。2022年实验室孵化创新企业拓元智慧,打造通用多模态认知AI技术平台,深度赋能企业数智化、元宇宙、智慧城市等主要应用场景。

作者简介

立即获取,开启智慧之旅

《多模态大模型》不仅是高年级本科生和研究生的理想教材,也是对多模态大模型感兴趣的读者的宝贵资源。本书在线资源(含目录、参考文献等)已经上线https://hcplab-sysu.github.io/Book-of-MLM/

现在就访问京东官方自营购买本书,开启您的人工智能学习之旅!

京东官方自营购买链接:https://item.jd.com/10100489294930.html

更多内容,点击下方关注:

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
AI早知道|商汤发布日日新5.0大模型;微软推出小语言模型Phi-3;腾讯旗下协作SaaS产品全面接入混元大模型脑认知与类脑智能重点实验室招聘实验室副主任超越 GPT-4V 和 Gemini Pro!HyperGAI 发布最新多模态大模型 HPT,已开源CVPR 2024 | 通过细粒度人类反馈对齐数据,提高多模态大模型可信度万字长文总结多模态大模型最新进展(Modality Bridging篇)元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入长篇小说连载《此世,此生》第五十八章三2024年AIGC行业研究:多模态大模型与商业应用|36氪研究院鲶鱼效应显著!Sora 发布满月,多模态领域成果丰硕 | 大模型一周大事国产多模态大模型开源!无条件免费商用,性能超Claude 3 Sonnet中科院,CMU,Meta等联合出品:去除LLM先验对多模态大模型的负面影响风云际会77级,黄埔军校第1期五光十色的多模态大模型:浅探视觉-语言大模型的关键模块设计国产多模态大模型狂飙!颜水成挂帅开源Vitron,破解图像/视频模型割裂问题大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事AI早知道|Apple 发布 MM1多模态大语言模型;xAI 是市场上薪酬最高的人工智能公司轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理看视频、画CAD、运动想像识别!75B的多模态工业大模型太能干了8B文字多模态大模型指标逼近GPT4V,字节、华师、华科联合提出TextSquare几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling​第一个基于Llama 3的多模态大模型!Bunny-Llama-3-8B-V上线!AI早知道|元象开源首个多模态大模型XVERSE-V;信通院发布国内首个汽车大模型标准AI视觉的“大一统”:从CV到多模态,从行业大模型到机器人,旷视如何布局?Mamba再下一城!Cobra:将Mamba扩展到多模态大语言模型旷视实战大模型:把多模态扎进行业「国家队」入局,多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资春媚,不是人人都官迷背水凤凰 一战到底——时趣《中国一线城市中产女性生活观及消费洞察报告》重磅发布美股基本面 - 2024_02_18 * 晚报 * 美联储票委暗示对降息三次持开放态度 扎克伯格称美科技业大裁员与AI无关 苹颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑熵泱——第十九章北京/上海内推 | 小红书智能创作团队招聘多模态大模型算法工程师/实习生文末送书 | 中山大学HCP实验室专著《多模态大模型》重磅发布多领域文献阅读超越GPT-4!深势科技发布科学文献多模态大模型Uni-SMART技术报告
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。