国际科技财经博客移民网络热点娱乐民生时事公众号

>

GPT-4、Llama3...大模型都有致命弱点！

GPT-4、Llama3...大模型都有致命弱点！

公众号新闻

2024-08-15 06:08

自ChatGPT发布问世，学业界便进入大模型时代，随着训练推理的深入，大模型也逐渐暴露出幻觉问题，一些回复与事实知识不符，研究落地面临极大挑战，于是，围绕其产生原因、检测机制、缓解方法等，近年顶会激增了一批大模型幻觉工作，在数据、基准、解码等多个层面，攻克方法层出不穷！

为了帮助大家综合掌握大模型幻觉，研梦非凡于8月21日晚（周三），邀请了从事多模态大模型研究的王导师，独家详解《大模型幻觉消失术：全面综述到顶会方法》（AI前沿直播课NO.62），主要涉及1篇华为的最新综述，以及1篇阿里&南洋理工CVPR'24收录工作，从LVLMs对象幻觉问题，再到产生原因、缓解办法，重点讲解顶会方法-视觉对比解码（VCD）核心原理，并具体演示代码，1节课速通！

扫描二维码找助教0元预约直播课！

凡预约即可免费领取200篇相关论文（20篇幻觉前沿+70篇多模态+120篇大模型）+文末还有算力等科研福利！

unsetunset直播课内容概览unsetunset

01 研究背景（最新综述）

LVLMs的对象幻觉问题

对象幻觉的概念和影响
易受影响的场景和行业

LVLMs面临的挑战

根本性问题
缓解问题的新方法VCD
VCD减少对象幻觉的原理

02 相关工作（最新综述）

多模态幻觉的含义
多模态幻觉产生的原因

数据：数据量不足、数据质量问题、缺乏多样性
视觉编码器：有限的视觉分辨率、细粒度视觉语义不足
连接模块：简单结构、有限的标记约束
LLM：不足的上下文注意力、随机采样解码

缓解幻觉的方法

数据优化
视觉编码器增强
连接模块改进
LLM的解码优化
后处理方法

扫描二维码找助教0元预约直播课！

03 VCD方法详解（CVPR'24）

视觉语言模型的解码
视觉不确定性加剧幻觉

视觉不确定性会放大语言先验
视觉不确定性会放大统计偏差

视觉对比解码（VCD）

设计目的
对比预测
自适应合理性约束

04 实验分析（CVPR'24）

实验设置和结果
数据集基准：POPE & MME

05 代码实现（讲解重点）

核心代码讲解
具体演示

06 总结和展望

导师简介

王导师

【学术背景】985硕出身，拥有丰富的深度学习研究、论文发表经验，多篇SCI论文、EI会议论文（一作）

【研究方向】大语言模型、视觉语言模型、多模态学习，以及自然语言处理、进化算法等

直播福利

参加本次直播的同学都将获得1小时导师meeting的福利（助教+导师）！原价2999，限时福利价9.9元！活动时间为8月21日到8月31日。

ps：研梦非凡开设的前沿论文系列直播，旨在帮助大家提升读论文技能，快速抓住重点，掌握有效方法，进而找到创新点，轻松完成论文报告。

扫描二维码找助教0元预约直播课！

unsetunset研梦非凡科研论文指导unsetunset

如果你的研究方向/方法/idea是属于CV全方向/NLP全方向/机器学习/深度学习及AI+金融、医疗、交通等方向，如果你需要发CCF A-C、SCI一区-四区、EI会议/EI期刊、毕业大论文、毕业设计等，都可以来研梦非凡，匹配合适的科研指导。

研梦非凡可指导的研究方向

主流方向科研论文常用方法

研梦非凡现有idea

扫码找助教了解更多/验证自己的idea是否可行

unsetunset研梦非凡科研论文指导方案unsetunset

idea并不是直接拍脑门拍出来的，是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。研梦非凡1V1定制化论文指导，和研梦导师一起找idea，研梦导师指导实验，共同解决数据问题。授之以渔——搭建论文写作框架，增删改查，针对性实验指导！哪里薄弱补哪里！

<<< 左右滑动见更多 >>>

扫描二维码咨询助教两种指导方案

unsetunset研梦非凡部分导师介绍unsetunset

研梦非凡导师团队，来自海外QStop200、国内华五、C9、985高校的教授/博士导师/博士后，以及世界500强公司算法工程师、国内外知名人工智能实验室研究员等。

这是一支实力强大的高学历导师团队，在计算机科学、机器学习、深度学习等领域，积累了丰富的科研经历，研究成果也发表在国际各大顶级会议和期刊上，在指导学员的过程中，全程秉持初心，坚持手把手个性化带教。包括但不限于以下导师～

<<< 左右滑动见更多 >>>

扫码加助教为你匹配合适课题的大牛导师

unsetunset研梦非凡科研福利unsetunset

90分钟人工智能零基础入门课免费领

7小时科研论文写作系列课免费领

数十节前沿论文直播课程免费领

50小时3080GPU算力免费领

百篇8月论文资料大合集免费领

报名本次直播课，9.9元即可享受原价2999元的1小时导师meeting（助教+导师）！

扫码领取以上6重粉丝专属科研福利！

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

ChatGPT「秘方」竟在拖LLM后腿？Karpathy、LeCun联手开怼RLHF！今日arXiv最热大模型论文：大模型对齐告别微调，直接编辑表征空间即可解决 Llama3比GPT-4o更爱说谎，首个大模型“诚实性”评估基准来了 | 上海交大超ChatGPT-4o，国产大模型竟然更懂翻译，8款大模型深度测评｜AI 横评用GPT-4纠错GPT-4！OpenAI推出CriticGPT模型；谷歌Gemma 2发布，与第一代相比性能更高丨AIGC日报有致命中毒危险！300多种罐装咖啡全国召回腾讯混元大模型产品品鉴会邀约 | 7月3日16:00 一起来体验混元大模型的全新产品方案每只100多，有了这些包，夏季造型都能美出新高度！大模型权威测试被曝翻车！更偏袒GPT-4等闭源模型，连提示词都区别对待首个WebAgent在线评测框架和流程数据管理平台，GPT-4、Qwen登顶榜首！有致命中毒危险！300多种罐装咖啡全美召回大咖云集！首届大模型安全研讨会开启注册，共同探索大模型的安全边界大模型技术狂飙！全面剖析大模型全链路技术，顶级专家带你突破瓶颈剑桥大学：基于语音的大模型攻击，轻松“操纵”多模态大模型同济、NUS等提出GalleryGPT，巧妙运用大模型收集绘画图像-艺术分析文本数据最强数学大模型易主！阿里千问新模型成绩超GPT-4o，网友：这才是真“草莓”大模型+蒙特卡洛树搜索，一招让LLaMa-3 8B奥数水平直逼GPT-4 原阿里巴巴集团副总裁黄海清加盟上海AI大模型“国家队”；科大讯飞星火大模型4.0发布丨AIGC日报 OpenAI“草莓”落地了？ChatGPT惊现神秘GPT-4o模型，网友热议：新版本提升不多，但逻辑推理有改进苹果大模型新成果：GPT-4o扮演用户，在场景中考察大模型工具调用，网友：Siri也要努力 | 开源首个WebAgent在线评测框架和流程数据管理平台来了，GPT-4、Qwen登顶闭源和开源榜首！“GPT-5”发布时间曝光！GPT-3是幼儿，GPT-4像高中生，新一代大模型将达博士水平 5亿参数“小模型”如何超越千亿级参数大模型GPT-3.5？从零开始，用英伟达T4、A10训练小型文生视频模型，几小时搞定 GPT-4o弱点暴露了，PDF长文档阅读理解仅45分赶超 GPT-4o，最强大模型 Llama 3.1 405B 一夜封神，扎克伯格：开源引领新时代再便宜也不买！这5种户型都是“穷人房”，买了吃大亏，想“脱手”都难！开源Llama 3.1一夜成最强大模型！超越闭源GPT-4o，OpenAI坐不住了专治大模型“刷题”！贾佳亚团队新基准让模型只挑错不做题，GPT-4得分不到50 大模型高考成绩公布，理科最多上「二本」/传娃哈哈总经理宗馥莉请辞/OpenAI 推出 GPT-4o mini 新模型

热点事件追踪