Redian新闻
>
【讲座】Llama 3技术剖析、微调、部署以及多模态训练

【讲座】Llama 3技术剖析、微调、部署以及多模态训练

公众号新闻
Meta公司推出了开源大语言模型Llama系列的最新产品—Llama 3,包含了80亿参数的Llama 3 8B和700亿参数的Llama 3 70B两个版本。Meta称其为“迄今为止最强的开源大模型”。

Meta官方数据显示,Llama 3 8B模型在MMLU、GPQA、HumanEval等多项基准上均胜过同参数量级模型Gemma 7B和Mistral 7B Instruct,而70B模型则超越了闭源的当红模型Claude 3 Sonnet,并且效果上完全能与Google的Gemini Pro 1.5掰掰手腕。

那Llama 3在结构上跟之前的版本有哪些区别?它的预训练和Post训练是如何进行的?如何对Llama 3进行微调?基于Llama 3是否能构建出更优质的多模态大模型?鉴于这些问题,我们特意组织了一次对Llama 3的讲座,全面剖析它的技术层面以及应用。 

 

1. 不仅剖析原理,更有实操案例分享

本次讲座主题是《Llama 3技术剖析、微调以及多模态训练》,将剖析Llama 3的核心技术,讲解如何基于Llama 3进行模型的微调和多模态模型训练和微调。本次讲座不仅会讲解技术理论,也包括了结合Llama 3的模型微调和多模态大模型微调两个项目Case,从应用角度让大家对Llama 3的效果有直观的理解。


2. 讲座大纲

  • Llama 3结构剖析、与Llama2区别
  • Pretrain技术解释:GQA, RoPE等
  • Postrain技术解释:SFT, PPO, DPO等
  • Case:基于Llama 3-8B模型微调和部署
  • 多模态大模型结构如Mini-Gemini、LLaVA
  • Case:  结合LLama 3的多模态大模型微调


3. 分享嘉宾

李老师

人工智能、大模型领域专家

  • 多家上市公司技术战略顾问
  • 曾任金融科技独角兽公司首席科学家
  • 曾任量化投资初创公司首席科学家
  • 曾任美国亚马逊推荐系统工程师
  • 深耕AI领域十余年,授课培养AI学员数万人


4. 时间安排

北京时间:2024年4月24日,20:00-22:00


5. 适合人群

  • 想学习大模型及微调的开发工程师
  • 想深入理解相关技术的算法工程师



 🔥 即将开始
立即扫码添加老师,免费参加~


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
鲶鱼效应显著!Sora 发布满月,多模态领域成果丰硕 | 大模型一周大事GPT-4劲敌Claude 3来了,上下文和多模态显著提升:OpenAI是可被超越的Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了90、长篇家庭伦理小说《嫁接》第二十四章 郎心似铁(2)全网首发!Llama 3技术剖析、微调、部署以及多模态训练旷视实战大模型:把多模态扎进行业【BHSE第194期讲座】大选年背景下的亚裔申请突围之道只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理北京/上海内推 | 小红书智能创作团队招聘多模态大模型算法工程师/实习生CVPR 2024 | 北大&电子科大提出RCBEVDet:毫米波雷达-相机多模态的感知架构关于 RAG、AI Agent、多模态,我们的理解与探索爆火的多模态微信交流群成立!视觉特征在语言空间中如何分布?武大、上海交大提出统一多模态自回归建模框架中科院,CMU,Meta等联合出品:去除LLM先验对多模态大模型的负面影响【小升初备考讲座】再次来袭!!St Paul's Girls' /Wycombe Abbey 为你解开备考谜团!多模态融合再度领跑ICLR 2024!这56种创新SOTA方案必看超越 GPT-4V 和 Gemini Pro!HyperGAI 发布最新多模态大模型 HPT,已开源​第一个基于Llama 3的多模态大模型!Bunny-Llama-3-8B-V上线!看视频、画CAD、运动想像识别!75B的多模态工业大模型太能干了《梅》&《忘掉吧昨天》我的岁月(二十三)梗图理解“天花板”!港中文终身教授贾佳亚团队推出多模态模型:GPT-4+DALL-E 3,王炸组合刷爆榜单AI鲜测 | Claude 3全面升级:多模态+100万Token上下文长度,OpenAI也拦不住了「国家队」入局,多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资亚马逊向人工智能初创公司Anthropic追加27.5亿美元投资;钉钉AI升级多模态,新增图片理解、工作流等丨AIGC日报多领域文献阅读超越GPT-4!深势科技发布科学文献多模态大模型Uni-SMART技术报告零一万物 API 上线,用户反馈多模态中文图表体验超过 GPT-4V一口气读完《沙丘》 ,零一万物宝藏API正式开箱!酷炫Demo实测,多模态中文图表体验超越GPT-4V吃鱼被刺卡住,急诊开胸手术找鱼刺,没找着…开源大模型王座再易主,1320亿参数DBRX上线,基础、微调模型都有七绝—红豆二首2024年AIGC行业研究:多模态大模型与商业应用|36氪研究院AI早知道|Apple 发布 MM1多模态大语言模型;xAI 是市场上薪酬最高的人工智能公司多模态融合56个创新点汇总!CVPR 2024 | 通过细粒度人类反馈对齐数据,提高多模态大模型可信度
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。