Redian新闻
>
同济校长郑庆华院士:大模型的四大缺陷

同济校长郑庆华院士:大模型的四大缺陷

公众号新闻


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。
转载自 | 大模型智能
来源 | 中国人工智能产业年会

郑庆华认为,大模型已经成为当前人工智能的巅峰,大模型之所以强,是依托了大数据、大算力和强算法,但是也面临着若干缺陷。

郑庆华总结了大模型存在的四大固有缺陷。

缺陷一是过度消耗数据和算力。大模型的参数量已达到万亿级别,训练数据规模和算力消耗与参数规模成正比。

缺陷二是灾难性遗忘。在新任务上训练会损害之前任务的性能;在问题求解阶段,无法记住处理过的数据或场景,比如在无人驾驶中,人脑对路况有记忆,但自动驾驶每次都要重新计算,并为此消耗了大量能量。

缺陷三是黑盒模型逻辑推理能力弱,大模型缺乏“分而治之”能力,在处理需要逻辑、数值推理等复杂问题时表现不佳,无法举一反三、触类旁通。

缺陷四是大模型不知道自己错了,也不知道为啥错,更做不到知错就改。以GPT4求解算术运算题的实例为例,对于在1381和1453之间选两个随机数相乘的结果给出了错误答案,被指出错误后,无法定位是语料,还是训练等原因,更无从修正。


技术交流群邀请函

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向
(如:小张-哈工大-对话系统)
即可申请加入自然语言处理/Pytorch等技术交流群

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
五光十色的多模态大模型:浅探视觉-语言大模型的关键模块设计ventura marathon----喜逢坛友李丰对话连文昭:大模型的想象与泡沫,机器人的「不可能三角」与未来 | 峰瑞创投对话开源大模型火了!(附99个大模型微调模型/数据/工具)!葛均波院士:将至已至,以梦为马——人工智能辅助结构性心脏病诊疗预计容纳 35 万颗 H100!训练 Llama 大模型的基础设施是如何搭建的中科院,CMU,Meta等联合出品:去除LLM先验对多模态大模型的负面影响今日arXiv最热大模型论文:大模型也来看球,还能判断是否犯规GPT-4、Gemini同时被曝重大缺陷,逻辑推理大翻车!DeepMind上交校友团队发现LLM严重降智超越思维链:大型语言模型的X链范式综述卷疯了!最强开源大模型Llama 3发布,最大参数4000亿,小扎内心:大模型比元宇宙香多了AI早知道|商汤发布日日新5.0大模型;微软推出小语言模型Phi-3;腾讯旗下协作SaaS产品全面接入混元大模型墨大联合新华社等发布基准框架,全面评估大模型的新闻写作能力和安全依从性【七绝】 初春 (十一真)一张上海宋庆龄中福会幼儿园集体照引发的寻人启事韩雅玲院士:展望心血管代谢学科发展,摹画疾病管理蓝图国产算力训练大模型的经验与教训ISSTA 2024 | 北大提出CoderUJB,面向代码大模型的可执行多任务代码评估基准揭示真实能力与局限杨雄里院士:脑机接口让人拥有读心术?有可能,但必须规避风险葛均波院士:中国介入医学发展及未来展望 | CCIF&CCPCC2024长期手机辐射,或致性功能异常、影响发育与脑活动?施一公院士:电磁辐射对生物系统的影响,这次说清楚了!【长篇小说】县委副书记(053)大厂打工人转型的四个路径,请参考今日arXiv最热NLP大模型论文:CMU最新综述:工具使用,大模型的神兵利器手术缩胃减肥的胖人趣事华中科技大学同济医学院附属同济医院发表的SCI论文,大数据分析简报(2024)GPT-4级模型Grok开源可商用!卷底层大模型的公司危了今日arXiv最热NLP大模型论文:一文读懂大模型的prompt技术今日arXiv最热NLP大模型论文:大模型RAG新宠!浙江大学发布自反馈检索增强方法人物 | 所罗门诺夫:大语言模型的先知叫板李彦宏、Llama 3 发布,大模型的开源闭源到底在争什么?当我绝望之后,却突然对这个纠结了小半辈子的巨大缺陷释怀了…苹果搭载大模型的 Siri,可能和你想的不太一样大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事“Kimi概念”降温,长文本“担不起”大模型的下一步
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。