Redian新闻
>
同济校长郑庆华院士:大模型的四大缺陷

同济校长郑庆华院士:大模型的四大缺陷

公众号新闻


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。
转载自 | 大模型智能
来源 | 中国人工智能产业年会

郑庆华认为,大模型已经成为当前人工智能的巅峰,大模型之所以强,是依托了大数据、大算力和强算法,但是也面临着若干缺陷。

郑庆华总结了大模型存在的四大固有缺陷。

缺陷一是过度消耗数据和算力。大模型的参数量已达到万亿级别,训练数据规模和算力消耗与参数规模成正比。

缺陷二是灾难性遗忘。在新任务上训练会损害之前任务的性能;在问题求解阶段,无法记住处理过的数据或场景,比如在无人驾驶中,人脑对路况有记忆,但自动驾驶每次都要重新计算,并为此消耗了大量能量。

缺陷三是黑盒模型逻辑推理能力弱,大模型缺乏“分而治之”能力,在处理需要逻辑、数值推理等复杂问题时表现不佳,无法举一反三、触类旁通。

缺陷四是大模型不知道自己错了,也不知道为啥错,更做不到知错就改。以GPT4求解算术运算题的实例为例,对于在1381和1453之间选两个随机数相乘的结果给出了错误答案,被指出错误后,无法定位是语料,还是训练等原因,更无从修正。


技术交流群邀请函

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向
(如:小张-哈工大-对话系统)
即可申请加入自然语言处理/Pytorch等技术交流群

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
李丰对话连文昭:大模型的想象与泡沫,机器人的「不可能三角」与未来 | 峰瑞创投对话超越思维链:大型语言模型的X链范式综述大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事GPT-4级模型Grok开源可商用!卷底层大模型的公司危了今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理开源大模型火了!(附99个大模型微调模型/数据/工具)!卷疯了!最强开源大模型Llama 3发布,最大参数4000亿,小扎内心:大模型比元宇宙香多了今日arXiv最热NLP大模型论文:CMU最新综述:工具使用,大模型的神兵利器大厂打工人转型的四个路径,请参考今日arXiv最热NLP大模型论文:清华大学:大语言模型的常见词僻意理解能力竟不如中学生百川智能王小川:大模型价格战是好事;智源发布全球首个低碳万亿语言模型Tele—FLM丨AIGC日报人物 | 所罗门诺夫:大语言模型的先知今日arXiv最热NLP大模型论文:大模型RAG新宠!浙江大学发布自反馈检索增强方法解决Transformer根本缺陷,CoPE论文爆火:所有大模型都能获得巨大改进ACL 2024 | 多目标直接偏好优化MODPO:大语言模型的多目标对齐【七绝】 初春 (十一真)今日arXiv最热NLP大模型论文:一文读懂大模型的prompt技术今日arXiv最热大模型论文:大模型也来看球,还能判断是否犯规杨雄里院士:脑机接口让人拥有读心术?有可能,但必须规避风险当我绝望之后,却突然对这个纠结了小半辈子的巨大缺陷释怀了…长期手机辐射,或致性功能异常、影响发育与脑活动?施一公院士:电磁辐射对生物系统的影响,这次说清楚了!Nature重磅:大模型的谎言如何“破”?牛津团队提出新方法,无需人工监督或特定领域知识一张上海宋庆龄中福会幼儿园集体照引发的寻人启事刷屏了,1亿元的保单一次付清!被保人0岁,自5岁开始每年可领300万元?知情人士:属实!业内人士:几个亿的大单也不稀奇了ventura marathon----喜逢坛友GPT-4、Gemini同时被曝重大缺陷,逻辑推理大翻车!DeepMind上交校友团队发现LLM严重降智【长篇小说】县委副书记(053)AI早知道|商汤发布日日新5.0大模型;微软推出小语言模型Phi-3;腾讯旗下协作SaaS产品全面接入混元大模型手术缩胃减肥的胖人趣事CoPE论文爆火!解决Transformer根本缺陷,所有大模型都能获得巨大改进两句话,让LLM逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷今日arXiv最热大模型论文:大模型对齐告别微调,直接编辑表征空间即可解决大咖云集!首届大模型安全研讨会开启注册,共同探索大模型的安全边界华中科技大学同济医学院附属同济医院发表的SCI论文,大数据分析简报(2024)五光十色的多模态大模型:浅探视觉-语言大模型的关键模块设计
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。