Redian新闻
>
线上开售!首场机器之心 AI 技术论坛圆满收官,这些大模型技术干货值得反复观看

线上开售!首场机器之心 AI 技术论坛圆满收官,这些大模型技术干货值得反复观看

公众号新闻


人工智能已经进入大模型时代,这将彻底改变 AI 在各行各业落地的模式,也对各行业的研发及技术从业者提出了新的 AI 技能要求。

致力于助力大模型技术升级的“Llama 2 大模型算法与应用实践”——机器之心 AI 技术论坛日前圆满收官。活动当日,北京望京浦项中心 B 座二层多功能厅座无虚席,全国十余个城市的 200 名参会者来到现场,在 4 位大模型技术大咖的带领下,系统拆解学习了 Llama 2 底层大模型技术,并动手搭建了自己的专属大模型,一起高效完成了大模型技术升级。

活动获得了参会者广泛好评

内容高质量、内容超过预期、讲解精彩深入、现场问答交流具有启发性、服务全面周到……参会者给予活动广泛好评,并表达了对更多层次丰富、内容深入的技术活动的期待。

此外,因城市距离、行程档期等原因,许多对活动感兴趣的朋友遗憾未能来到现场。为了回应大家的学习实践需求,机器之心官网知识站(https://vtizr.xet.tech/s/1GOWfs)现上线本场论坛现场视频。全套视频售价 699 元(购买成功后请添加机器之心小助手 ID:13661489516,获取配套会前会后学习资料包)。立即购课学习,开启你的大模型技术升级之旅吧!

系统讲解:最新技术进展与前沿应用案例

上海交通大学清源研究院长聘教轨副教授、生成式人工智能研究组(GAIR)负责人刘鹏飞

“把模型训练得足够透彻,在一个比较小的模型里也可以达到一个非常好的性能。”第一位主讲人刘鹏飞专注于自然语言的预训练、生成和评估等研究方向。

Llama 2 作为大模型市场上原创程度最高、训练技术细节最透明、口碑最好的预训练语言模型,极富研究价值。本次,刘鹏飞以《Llama 2 大模型技术解读》为主题,从 LLaMA 的诞生背景、重要概念、Llama 2 与训练技术、Llama 2 对齐技术出发,深入解读了 Llama 2 及其 Chat 版本所涉及的技术栈细节,分享了他的优化实践经验,包括“数据源配比权重、上采样”等技术细节,并探讨了大模型发展突破难点。


老刘说 NLP 技术公众号作者、开源爱好者刘焕勇

基础模型对算力、算法要求很高,更多的行业应用选择基于基础模型做行业大模型,并进一步做细分领域。“基于行业大模型,基础模型中包括的垂类领域数据比较少,容易出现幻觉,效果不如人意。”主讲人刘焕勇介绍,Llama 虽不是中文市场最佳选择,但因为率先开源可商用而积累的丰富行业落地案例非常珍贵。

他以《基于 Llama 系列开源模型进行行业落地的实践范式与案例解读》为题,分享了 Llama 系列模型与其他开源模型的对比及其汉化机制,解读了基于 Llama 系列模型的领域微调模型案例、“基于LLama 系列模型+知识库增强”的落地应用案例。总结了做行业领域模型微调的算力条件、数据数量和质量要求、ROI 和场景等行业微调模型的必备条件,强调了大模型落地行业的形态可能是多源异构数据、文档智能分析、知识库规范。

LinkSoul.AI  CEO、Chinese Llama 2 7B 项目发起人史业民

随着大模型技术的发展,多模态大模型越来越成为驱动具身智能和更好用户体验的关键,必将成为下一代人工智能技术的关键组成部分。基于 LLM 的改造是目前效果最好的多模态模型方案之一,具有极大的研究和实践价值。

主讲人史业民以《基于 Llama 2 的多模态大模型技术与实践》为题,整理分享了多模态模型的模式和原理,深入分享了视觉多模态大模型和语音多模态大模型的改造实践,包括旧模型支持新模态、新能力需要考虑的重点,多模态改造的几种方案及需要注意的训练细节。他认为做多模态模型最大门槛是数据,分享了基于模型生成图片或者图文数据的方法路径。


Chinese Llama 2 7B Contributor、大模型布道师苏洋

“量化与微调”是本次活动调研中参会者最为关注的行业应用内容。苏洋本次带来了《Llama 2 开源模型量化及低成本微调实战》专题分享,介绍了开源模型生态与 Llama 生态的现状、量化与微调的主流方案以及“这两个事情有多简单”。

“微调建议使用开源业界分享出来的 SOTA方案,而不是盲目追求原创。”他强调量化和微调在遵循各种原理的基础上,具有相对较强的实践性。实际的模型量化过程不是简单的一刀切,有非常多的维度、参数,在每一层、每一列都要进行最合理的量化或者转化,而微调也需要考虑具体的训练环境、硬件环境和基础系统环境,苏洋对此展开了深入讲解。


动手实践环节

在进行了详细的技术解读和案例解析之后,史业民和苏洋一起带领现场参会者,上手进行了大模型训练、量化和微调实践。

史业民重点讲解了基础模型选取、训练技巧和经验,包括基于一个 base model 从头训练和基于开源模型做词表扩充训练两条路径,以及对应的架构、模型大小、是否可商用、是否扩词表等筛选条件,并回答了 SFT 数据集等相关问题。

苏洋则带着现场参会者从部署镜像、载入模型、加载数据集、配置 Lora 和 QLora 两种方案的 SFT 参数、使用 Transformers 等工具,进行了快速的微调,跑通了私属大模型微调训练流程,帮助参会者更好地吸收了本次活动的内容干货。

未来,机器之心将保持对行业前沿和开发者需求的关注与追踪,不断打造高质量的大模型技术系列活动,助力广大开发者快速提升工程实践、创新应用能力,为大模型时代做好准备,欢迎持续关注机器之心 AI 技术论坛活动。

点击「阅读原文」购买课程

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
于向真:我眼中的新加坡让GWU学生申研横着走!TOP20名校录取拿不完!常青藤北美GWU校园行专场圆满收官,期待未来与你们顶峰相遇恍如隔世【最新】长三角铁路暑运圆满收官,发送旅客近1.68亿人次创历年新高!你出游了吗?大模型技术太难啃?来这场论坛高效完成技术升级港大ICB 「超越自我 明德笃行——2023年秋季校内工作坊」圆满收官IM两岸青年影展 | 谱写平潭故事 72小时极拍圆满收官“唤醒、成长、融合、创新” —— 2023 IEEE WIE 女工程师领导力论坛圆满闭幕ADA 2023秋季学期即将火热开启 | 暑期集训营圆满收官让美本学生申研横着走!TOP20名校录取拿不完!常青藤北美校园行圆满收官,期待未来与你们顶峰相遇看了上百本育儿书,最推荐这一本!值得反复阅读,每次都有新收获第十二届中国创新创业大赛(内蒙古赛区)圆满收官!鄂尔多斯高新区高质量发展研讨会成功举办!圆满收官!共获3金1银1铜2023年香港大学全国创新创业大赛北京赛区初赛圆满收官!36氪创投氪堂DEMODAY路演日圆满收官丨路演回顾智融万物 创见未来|中国移动物联网开发者大会暨物联网产业论坛圆满举行2023“渝见澳洲”少年推介官选拔赛系列活动圆满收官现代来袭之后,淳朴荡然无存!大模型持续技术升级,你需要这样一场干货满满的技术论坛孩子们暑假做好这一件事就行,有它帮忙事半功倍!回购了2年值得反复推荐~功承瀛泰南北携手发力涉外服务!“涉外法律服务的内涵重塑与价值提升”论坛圆满举行【洞悉新形势,把握新机遇,共话新发展 】第十一届慕尼黑上海分析生化展圆满收官!Llama 2 的入门与实战,机器之心邀请了 4 位技术大牛手把手教你智能澎湃,大有可为——机器之心2023年度榜单正式启动茶和天下,共饮茶香| 2023国际茶业合作发展论坛圆满落幕!书识(九)乱世爱情地方动态丨第九期首都留学人员专题培训班学习之旅圆满收官厦门打造国际赛场揽英才!第六届中国厦门海外创业大赛(北美赛区)圆满收官如何赚取千倍收益?他在A股、港股暴赚4000倍,这些经验值得反复学习2023Hooli罗岛团建圆满收官!长三角-粤港澳大湾区第二届集成电路“太湖之芯”创业大赛,圆满收官!快手APP上了大模型对话,这是机器之心一手体验InfoQ 大模型技术应用创新大赛扬帆起航:汇聚创新技术,助力数字经济发展第六届进博会圆满收官,六大关键词盘点拜耳本届亮点
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。