Redian新闻
>
AI专家:大模型同质化严重,面临十大科学挑战

AI专家:大模型同质化严重,面临十大科学挑战

公众号新闻

2023.08.25

本文字数:2393,阅读时长大约4分钟



导读邱锡鹏总结了包括模型架构、幻觉、多模态的延展、知识来源、自动化评价、平民化等十个科学挑战。


作者 | 第一财经 金叶子

今年2月,复旦大学邱锡鹏团队发布MOSS,成为国内首个发布的类ChatGPT模型,而从ChatGPT诞生至今已过去9个多月,大模型又面临哪些挑战?
在24日下午上海市科协举办的青年科学家论坛上,复旦大学MOSS系统负责人邱锡鹏表示,大语言模型是当前自然语言处理的主流范式,它可以涌现出丰富的知识和能力,但也带来了一些挑战和问题。在他看来,大语言模型的研究需要多方面的合作和创新,需要开放和共享的技术平台和评测标准。
呼吁业界开放共享技术
“大模型确实给我们的研究带来非常多的问题,一方面是同质化非常严重,另外就是赛道拥挤,大家原来把各切一块的研究范式都往一个赛道挤。还有就是评价困难。”
邱锡鹏解释,现在大家做的东西总体上比较雷同,比如说像预训练,虽然有创新性的东西但总体不多,目前的“千模大战”在创新性上并没有多少差异。而在评价方面,大家都说自己做得好,但又没有好的比较方法。因为对大模型、生成式人工智能的客观评价方法并不是特别有效,导致每个人都要自己建一套评价标准,这就没有一个比较方法,从而给整个研究带来一定的困难。
“现在很多人认为大模型变成工程性问题了,是不是还有科学价值?”在他看来,ChatGPT发布至今已经过去9个多月了,大家都感觉好像很明白它了,事实上很多观念的地方还是不明白。目前业界对整个技术路线是有一些掌握,这离不开学术界一直在发论文探讨。邱锡鹏说,现在有做大模型的团队只宣布做出来的效果,并未公开究竟是怎么做的,但大模型的研究只有保证技术的公开度才能使大家都参与进来,让技术持续不断往前迭代。“当然这涉及到很多算力问题和能耗问题,希望可以有更好的优化方法,使大模型普惠化,使所有人降低门槛,所有人都参与进来进行研究。”
十大科学挑战
谈到大语言模型面临的挑战和问题,邱锡鹏总结了包括模型架构、幻觉、多模态的延展、知识来源、自动化评价、平民化等十个科学挑战。
他说,大模型之所以称为大模型,是因为可以涌现出丰富的知识和能力。目前大家熟知的Transformer架构非常强大,但缺点也明显,当文章长度变得更长得时候,它的复杂度就变得非常高,因此也限制了模型的进一步扩大。“我们要找到一种可能比Transformer更有效的架构,才能支持未来模型的进一步扩大。”
邱锡鹏还特别强调了大模型的平民化问题,因为平民化能让资源不多的研究者也能使用大模型。
他认为,大模型总的来讲不仅仅是工程问题,从迭代周期来看的话,大家需要的算力比较多的是预训练阶段,这个阶段也有很多东西可以做。但是如果往后看,包括像对齐、优化、指令微调等方面需要的算力没有想象中那么大。“随着将来大模型普惠化、平民化的工作,大家在3090显卡上就可以开展关于大模型的研究。我总体上会觉得大模型的研究,不管是学术界还是工业界的科研单位,里面都有很多科学问题,还是值得关注的,这不仅仅是一个简单的工程问题。”
关于MOSS的下一步计划,邱锡鹏透露,后面会追求一些创新性,在一些新架构上做一些探索,比如不断加强像推理、代码这些能力。
微信编辑 | 小羊

推荐阅读


重磅!大众汽车7亿美元入股小鹏汽车,奥迪与上汽合作落地



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
2023年英国高级数学挑战赛真题及答案出炉纽约开学挑战,2万非法移民学童入学!中国医疗队在坦桑尼亚记实 (七)为台湾与中国开战?美国|纽约开学挑战,2万非法移民学童入学!任正非称不学英语农村孩子永远是农民,同质化教育把天才埋没了Key West的鸡和围墙芝加哥华人,为了$5600,面临十年监禁!摊上大事!中国留学生隐瞒毕业学校,面临十年监狱!挑战TikTok“地铁冲浪” 两名14岁男孩一死一重伤!社媒各类恐怖挑战何时休?“昏迷挑战”、“破颅挑战”已造成多人死亡理想城市 NOA 实测:大模型加持的辅助驾驶,挑战北京「地狱级」路线股权投资市场骤冷:情绪化严重,回暖亟需积极信号早鸟报|B站将用播放分钟数代替播放次数;微信否认文件传输助手是真人;抖音打击蹭高考热点同质化内容...大数据在大模型趋势下的“新姿态”:大模型与企业数据充分协同荧屏再掀“宝藏乡村”热,如何做到避免喊口号、贴标签、同质化?20B跨级挑战70B性能!国产开源大模型打造大模型新标杆排队N小时,拒签1分钟!美签大面积被拒?中国赴美留学生因一个举动,还面临十年监禁!【找队友】全美经济学挑战赛(NEC)正在组队,冲全球赛头部排名,有相同目标的来同质化角色、脸谱化演技究竟害了谁?百模大战的同质化窘境:百花齐放还是重复造轮子?下周,天气凉快了!法国这些街区贫困化严重,包括巴黎市内!滨海房价飙升!召回这些奶酪乡间小路沉浸式餐厅如何突破同质化?全球十大沉浸式餐厅告诉你,餐厅还能这样玩自由女神港股基金分化严重,这一板块跌成重灾区!利好因素纷至沓来,港股将否极泰来?日本叫嚣插手台湾,专家:执意玩火将会面临严重后果最高将面临十年监禁! 诈骗医保超2500万!! 纽约华人药房老板认罪...纽约开学挑战,2万非法移民学童入学!纽约准备好了吗?汇智智能联合创始人刘黄骁烈:大模型应用正面临「GNOMIC困境」隐瞒国防七子学历,中国留学生被控签证欺诈最高面临十年监禁百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报英国不加息, 英镑猛跌!MPC分化严重! 英国签证费上涨明细表WAIC十大AI商业落地趋势:大模型新玩家融资难度升级,云计算洗牌战来了中国移动首席科学家:大模型催生产业合作新模式摊上大事!留学生隐瞒中国毕业的学校,面临十年监狱!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。