Redian新闻
>
AI大模型,这个就叫专业!

AI大模型,这个就叫专业!

公众号新闻

清华团队推出 MiniCPM:利用可扩展的训练策略挖掘小模型潜力;

苹果MM1大模型:30B参数,多模态,在预训练指标上达到SOTA;

亚马逊提出大规模视频语言对齐方法VidLA;

英伟参与,高效视频扩散模型CMD发布;

谷歌、Stability AI新研究:由文本引导生成纹理3D服装;

港大、阿里新研究:只需一张图,轻松即时定制个性化照片;

上海 AI Lab 新研究:将 LVLM 分辨率提升到 4K HD。

大模型正在重构一个新的人工智能,技术的更迭也是日新月异,这次我整理了近3个月的包含谷歌/苹果/亚马逊/阿里等最新大模型研究102篇大模型论文,给大家做学习参考。


扫码回复“大模型

领最新100+篇大模型论文合集




AI大模型,正在改变世界,为了更好的入局AI大模型,这次我特意复盘和整理大模型学习脉络,开了30节大模型的课程,包含大模型理论、大模型论文带读以及大模型企业项目实战,还附赠500+大模型论文。


0.01元解锁30节“AI大模型系列课程

领500+篇大模型论文合集



以下是《AI大模型系列课》课程目录


第一课:NLP大模型:基础、前沿与学习路径


第二课:基于模型量化的大模型压缩的进展

🔻 压缩技术中,为什么量化要优于剪枝、蒸馏?

🔻 如何搜索裁剪阈值用于裁剪outlier?

🔻 包含有异常值outlier的特征如何量化?

第三课:基于模型剪枝的大模型高效计算和应用

🔻 模型剪枝的技术背景

🔻 模型剪枝具体方法

🔻 模型剪枝前沿方法

🔻 语言模型剪枝实例

第四课:讲解扩散模型的基础知识及拓展应用

🔻 AI作画--以文生图

🔻 扩散模型是什么

🔻 扩散模型工作拓展

🔻 扩散模型带来的机遇

第五课:大语言模型的RLHF

🔻 RLHF的优点和挑战

🔻 RLHF如何改善大模型性能

🔻 RLHF的实际应用案例

🔻 RLHF在大模型的未来趋势

第六课:[LLM + 微调]大模型的高效微调

🔻 01 介绍

🔻 02 常用的高效微调方法介绍

🔻 03 如何针对领域数据集根据高效微调方法创造大语言模型

🔻 04 未来挑战与研究方向

第七课:大模型医疗

🔻 医疗领域的数据特点、挑战和机遇

🔻 大模型的定义和特点,如预训练、微调、指令学习等

🔻 针对ChatGLM大模型,介绍ChatGLM模型微调

🔻 代码实践以及模型微调

第八课:大模型基本概念以及应用场景

🔻 发展线路与技术手段

🔻 应用场景

🔻 缺点与局限

🔻 未来展望

第九课:LLAMA2中文大模型

🔻 理论介绍

🔻 代码实践

第十课:大模型前沿论文带读训练营(NLP方向)

🔻 01 LLaMA训练营

🔻 02 LLaMA训练营——精读

🔻 03 LLaMA训练营——代码讲解

🔻 04 GLM-130B训练营——论文泛读

🔻 05 GLM-130B训练营——论文精读

🔻 06 GLM-130B训练营——代码讲解

🔻 07 Alpaca训练营——论文泛读

🔻 08 Alpaca训练营——论文精读

🔻 09 Alpaca训练营——代码讲解

第十一课:掌握大模型领域前沿,跑通三套企业级项目代码

🔻 01 开发基于大模型的聊天机器人

🔻 02 实战基于大模型的对话系统(实战一)

🔻 03 大模型模型原理及综述

🔻 04 大语言模型(LLM)原理及综述

🔻 05 精读大模型-3论文、Instruct论文

🔻 06 精读谷歌PaLM论文、脸书LLaMA论文

🔻 07 实战基于模型的对话系统(实战二)

🔻 08 实战微调LLaMA模型


扫码回复“大模型

领500+篇大模型论文合集


在大模型的构建之下,AI自动化交互,将会决定世界的未来,谁的大模型更强大,将决定在遥远的未来的话语权,同时,大模型会成为AI基础设施。


2024年也必将是大模型继续活跃的一年,不想错过大模型机遇的同学,赶紧0.01元扫码获取30节《AI大模型系列课程》!

0.01元解锁30节“AI大模型系列课程

领500+篇大模型论文合集

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
五光十色的多模态大模型:浅探视觉-语言大模型的关键模块设计《Valentine's Day without a Valentine》《没有情人的情人节》北京内推 | 微软亚洲研究院WWE大模型团队招聘大模型研究实习生2024年读书笔记(一)周鸿祎向李彦宏“开炮”:有些名人胡说八道别被忽悠了;全球最强开源大模型Llama 3发布:最大模型参数将超4000亿丨AI周报今日arXiv最热NLP大模型论文:天津大学发布大模型数学能力细粒度评价基准FineMath今日arXiv最热NLP大模型论文:一文读懂大模型的prompt技术让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述今日arXiv最热NLP大模型论文:华东师大发布对话级大模型幻觉评价基准DiaHalu开源大模型火了!(附99个大模型微调模型/数据/工具)!苹果也发布了自己的大模型,这是一件影响深远 的大事AI大模型之路 第三篇:从零实现词嵌入模型,加深理解!破解大模型安全难题,360推出大模型安全能力框架今日arXiv最热NLP大模型论文:微软:用大模型分析用户满意度,让智能系统更善解人意今日arXiv最热NLP大模型论文:Github万星!北航发布零代码大模型微调平台LlamaFactoryMeta、微软、Mistral AI、Hugging Face、通义、港中文六路进发开源大模型 | 大模型一周大事全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报今日arXiv最热大模型论文:大模型也来看球,还能判断是否犯规给大模型装上眼睛,李学龙团队提出Any2Point,让大模型具备3D视觉理解能力AI早知道|马斯克Grok大模型开源;荣耀正式发布首款AI PC;苹果谷歌和OpenAI商谈iPhone大模型使用美众议院再通过反TikTok法案,伴伴正式宣布停运,哪吒张勇否认影射雷军,微软紧急撤回最新大模型,这就是今天的其他大新闻!360安全大模型3.0来了!垂直大模型,他们这么训今日arXiv最热NLP大模型论文:浙江大学:蒸一蒸,多Agent变成单一模型,效果更好200+ 大模型产品全景盘点!探索大模型带来的创新机遇【立即获取报告】今日arXiv最热NLP大模型论文:微软发布可视思维链VoT,提高大模型空间想象力大模型如何用于游戏?游戏玩家代理与大模型综述:方法、应用与挑战卷疯了!最强开源大模型Llama 3发布,最大参数4000亿,小扎内心:大模型比元宇宙香多了AI早知道|商汤发布日日新5.0大模型;微软推出小语言模型Phi-3;腾讯旗下协作SaaS产品全面接入混元大模型AI早知道|360安全大模型3.0发布;通义听悟上线音视频问答助手;腾讯混元大模型参数规模扩展至万亿今日arXiv最热大模型论文:清华把大模型用于城市规划,回龙观和大红门地区成研究对象少许暗藏的幸福清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!今日arXiv最热NLP大模型论文:大模型RAG新宠!浙江大学发布自反馈检索增强方法孤独的晨跑美股基本面 - 2024_02_15 * 午报 * 美国零售销售在强劲的假日季过后创近一年来最大降幅。英国央行官员Greene
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。