Redian新闻
>
大型语言模型专场上线!四位AI新青年直播讲解MiniGPT-4、LLaVA、Gorilla以及大型语言模型Token危机

大型语言模型专场上线!四位AI新青年直播讲解MiniGPT-4、LLaVA、Gorilla以及大型语言模型Token危机

公众号新闻

「AI新青年讲座」由智东西公开课出品,致力于邀请青年学者,主讲他们在生成式AI、LLM、计算机视觉、机器学习等人工智能领域的最新重要研究成果。


AI新青年是加速人工智能前沿研究的新生力量。AI新青年的视频讲解和直播答疑,将可以帮助大家增进对人工智能前沿研究的理解,相应领域的专业知识也能够得以积累加深。同时,通过与AI新青年的直接交流,大家在AI学习和应用AI的过程中遇到的问题,也能够尽快解决。


在这个大模型的时代,开源的力量正在影响着整个AI社区。MiniGPT-4、LLaMA、Gorilla 等各种开源的大模型纷纷出现,并且在快速的迭代着。相比于 ChatGPT、GPT-4,这些开源模型的效果具有更强的可定制性,并且可以免费使用。


为了让大家更好地了解学习这些开源的大型语言模型,7月起,AI 新青年讲座开辟推出「大型语言模型专场」。


阿卜杜拉国王科技大学在读博士朱德尧、新加坡国立大学在读博士薛复昭、美国威斯康星大学麦迪逊分校在读博士柳昊天和加州大学伯克利分校人工智能实验室(BAIR)在读博士张天均将参与此次专场。


四位 AI 新青年将分别针对 MiniGPT-4、LLaMA、Gorilla,以及大型语言模型所面临的 Token 危机进行直播讲解。



第一讲|阿卜杜拉国王科技大学在读博士朱德尧:使用大型语言模型为 MiniGPT-4 构建视觉语言理解能力


GPT-4 展现出了前所未有的视觉语言能力,例如解释表情包的笑点,或者根据网站草图直接生成网页代码等等。这样的能力是之前的视觉语言模型所无法企及的。然而,OpenAI 并没有公开 GPT-4 的任何技术细节,其非凡的视觉语言能力的来源是一个谜。


我们认为 GPT-4 的秘密在于其强大的语言模型。为了验证我们的想法,我们构建了一种新颖的训练方法,将开源的视觉模型与开源的先进的大型语言模型进行对齐。我们的模型系统 MiniGPT-4,成功地复现了许多 GPT-4 的视觉语言能力,并验证了我们的猜想。


MiniGPT-4 开源地址:

https://github.com/Vision-CAIR/MiniGPT-4


第二讲|新加坡国立大学在读博士薛复昭:大型语言模型的 Token 危机


训练数据集的大小,即 tokens 数量对大型语言模型的性能有很大影响。然而网络上高质量的文本数据已接近 LLMs 的扩展极限。为了进一步增强 LLMs 的性能,一种直接的方法是重复使用预训练数据进行额外的迭代。


在本次分享中,首先将向大家介绍重复使用预训练数据进行额外迭代影响是什么?进而分析预训练大模型的性能下降原因。之后,将讲解降低多 epochs 影响的方法:正则化(Dropout),以及基于混合专家(MoE)的超参数调整等。最后,也将对 LLM 高效开发的未来进行探讨。


第三讲:美国威斯康星大学麦迪逊分校在读博士柳昊天:基于视觉指令调整的多模态聊天机器人 LLaVA


LLaVA(Large Language and Vision Assistant)是一个由威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学研究者共同发布的多模态大模型。其有着接近多模态 GPT-4 的图文理解能力:相对于 GPT-4 获得了 85.1% 的相对得分。当在科学问答(Science QA)上进行微调时,LLaVA 和 GPT-4 的协同作用实现了 92.53%准确率的新 SoTA。


在本次分享中,将首先向大家介绍 LLaVA 的开发背景。之后将讲解多模态指令微调训练多模态聊天机器人 LLaVA,包括如何使用仅支持语言输入输出的聊天机器人(ChatGPT)生成多模态指令微调数据集、仅使用单层全连接网络联通语言大模型(如LLaMA)与视觉大模型(如CLIP)的模型结构等。最后,也将向大家分享 LLaVA 的涌现能力 OCR、表情包理解以及后续的研究工作。


LLaVA 开源地址:

https://github.com/haotian-liu/LLaVA


第四讲|加州大学伯克利分校人工智能实验室(BAIR)在读博士张天均:Gorilla——链接海量 API 的大型语言模型


大型语言模型在近年备受关注,ChatGPT 和 GPT-4 都展现了非常令人吃惊的能力,在聊天代码等方面尤为显著。但当语言模型作为助手去完成一项任务时,它会需要学会使用各种工具。这在当前的语言模型里还是比较匮乏的。ToolFormer 等文章为大家展现了一个语言模型和工具互动的范例,但其实用的工具非常局限。


我们提出了 Gorilla, 一个可以和 1600+ API 互动的语言模型,我们在 HuggingFace,Tensor Hub 和 Torch Hub 上的表现都超过了 GPT-4。Gorilla 很大程度上减少了语言模型的幻想,能更准确的使用 API。


Gorilla 开源地址:

https://github.com/ShishirPatil/gorilla


 报名方式


对大型语言模型专场感兴趣的朋友,可以扫描下方二维码,添加小助手李宛儿进行报名。已添加过李宛儿的老朋友,可以给李宛儿私信,发送“LLMs”即可报名。


同时,为了方便大家交流和咨询,针对「AI新青年讲座·大型语言模型专场」还设置了专属技术交流群,将会邀请主讲人加入。希望加入交流群与主讲人直接认识和交流的朋友,也可以与李宛儿进行申请。


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
冷得的不止季节(67)— 晕厥【限时】10场大型语言模型前沿技术分享周末随笔吴恩达力赞!哈佛、MIT学者用下棋证明:大型语言模型确实「理解」了世界研讨会上新!直播讲解全匿踪联邦学习技术与面向 AIGC 的 TEE 异构算力网络GPT-4、ChatGLM2、Llama2、PaLM2在KDD LLM Day上一起开了个会关于大型语言模型的争论和局限有证据了,MIT表明:大型语言模型≠随机鹦鹉,确实能学到语义刘知远等众多机构提出ToolLLM:促进大型语言模型掌握16000+真实世界的APIs阿里云倚天实例技术公开课上线,两节课直播讲解倚天实例技术架构、应用实践与软件迁移解密大型语言模型:从相关性中发现因果关系?为期五年,Ginkgo牵手谷歌开发新型大型语言模型,助力药物发现和生物安全领域英国永居这样轻松获得!线上直播讲解最新移居英国途径,还有以房养学攻略,快来预约!【𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶无痕内裤】49元三条!巨巨巨好穿 !!简直就是辣妹顶配,食品级冰箱收纳盒【一日团】大型语言模型(LLM)的潜力有多大?中文医学大模型“本草”(原名华驼):医学知识增强在中文大型语言模型指令微调上的初步探索大规模视觉基础模型应用在线研讨会上线!南开、港中文、南京理工和微软亚洲研究院的四位青年学者将直播讲解大型语言模型与知识图谱协同研究综述:两大技术优势互补最新综述!当大型语言模型(LLM)遇上知识图谱:两大技术优势互补人大教授赵鑫介绍ChatGPT发展历程以及大模型技术特点 | 线上讲座报名中长篇小说连载《此世,此生》第五十章六𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶内衣裤,软弹有度,上身0束缚~如何更好地蒸馏ChatGPT模型能力:Lion闭源大型语言模型的对抗性蒸馏模型原理及实验工作介绍中国农工民主党的创始人 邓演达先生是中国国民党左派的杰出领袖之一GPT作文能力比拼:GPT3.5、GPT4、百度文心一言、讯飞星火银行业专用大型语言模型落地大型语言模型与知识图谱:机遇与挑战ChatGPT路线图曝光:没有GPT-5、识图功能要等到明年、GPT-3或将开源【保姆级】深入解析大型语言模型核心技术字节李航等发表最新《可信赖的大型语言模型》综述,提出七大维度大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4ToolsG7, immigrants邀请您参加IEEE网络技术论坛:基于大型语言模型的组合推理ChatGPT企业版炸裂上线!无限制访问、两倍速、3.2万token……OpenAI开始“抢钱”了|GGView超越 GPT-4!加州大学伯克利分校与微软研究院合作开源大型语言模型 Gorilla
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。