Redian新闻
>
大模型突飞猛进,但我们离真正的AGI还有距离

大模型突飞猛进,但我们离真正的AGI还有距离

公众号新闻

2024.01.18

本文字数:1877,阅读时长大约3分钟



导读:寻求基础技术提升和向行业去落地是未来两大主题。


作者 | 第一财经 刘晓洁

一次可读30万汉字,大模型又“上新”了。


1月17日,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.0(InternLM2),相比此前的版本,书⽣·浦语2.0在长语境输入及理解能力、基础语言能力上都有大幅提升,拓宽了大模型向行业落地的可能性。实验室表示将继续提供InternLM2免费商用授权。


在过去的一年,大模型接连发布、不断迭代,来到2024年这种势头还未停止。上海人工智能实验室领军科学家林达华对第一财经表示,大模型会比去年发展更快,“如果说2023年大家可能都是朝着一个目标,就是去追赶GPT-3.5或者GPT-4的性能目标去走的话,未来不同的机构、企业和团队会朝着不同的方向去发展,会更加多样化。”寻求基础技术提升和向行业去落地是未来两大主题。


对于此次书⽣·浦语2.0的更新,一次可读30万汉字(约五六百页的文档)、200k的长语境输入及理解能力是亮点,除了支持超长上下文外,其能够准确提取关键信息,这意味着模型可以显著拓展应用场景,比如支持大型文档的处理、复杂的推理演算和实际场景的工具调用等。


在具体应用方面,上海人工智能实验室领军科学家林达华对第一财经介绍,可用书⽣·浦语2.0模型尝试去读几百页的财报,它能够将财报里面一些非常细致的信息精准提取出来,形成摘要,或者能听一场几个小时的会议,虽然语音识别文档会有错误,但这并不影响理解,模型依然能很好地将会议的关键信息摘取出来。


InternLM2总结“联合国2023年10月2日召开的联合国贸易和发展会议记录”


除此外,此次更新后更强大的数理能力、工具调用的能力,以及明显改善的对话创作等方面的能力,都能够为大模型的应用带来很大的帮助。


“能力的持续提升,能够拓宽大模型向行业落地的可能性,它不仅仅是做对话,在行业里,它还能自由调用工具给很多垂直场景提供助手的能力,将一个大模型从闲聊的工具,逐渐变成能够和场景需要相结合、深入落地提供价值的利器。”林达华表示,媒体、教育、金融、传统制造业这些场景,都可以受益于大模型技术的进展。


回顾2023年,林达华认为有非常多惊喜,大模型有几个非常关键的进展。一是GPT-4的出现,让大家看到了大模型不仅仅是一个一本正经胡说八道的聊天工具,意味着它真正有用,其次,函数工具调用的能力、代码解释能力,让大家看到了大模型向现实场景衔接的可能性和技术途径,对于落地很有帮助。另外很重要的是模型推理能力、推理速度、推理性能的急剧提升,对于降低落地成本、门槛也非常重要。


对于未来大模型发展的趋势,林达华认为,一方面是基础能力的提升,“我们现在离真正的通用人工智能有较大的距离,无论是国内的模型还是GPT-4。”因此,未来会有顶尖的研究机构沿着更强的技术手段,如扩大规模、用更好的数据,或改进训练的方法,模型架构,逐渐向通用人工智能靠近,这是一个核心技术层面的突破,也是顶尖研究机构的使命。


上海人工智能实验室主任助理、领军科学家乔宇同样表示,我们做大模型能力越来越强,但离真正比肩人类的、可信的AGI还有距离。他认为,过去人工智能兴起核心的一点是大力出奇迹,堆更多的数据、用更多的算力,但只靠规模、只靠数据解决不了幻觉、可信和可控的问题。未来大模型的发展应该是以规模增长为主线、但又要充分吸纳其他技术路线的方向。


林达华对第一财经补充表示,规模(scale)路线确实是在过去这两年验证了的非常有效的手段,无论是数据规模和算力规模,但很多学者认为单纯依靠这个路径,不一定能够真正到达AGI的彼岸,有些核心的问题如幻觉、可信,需要规模路线与其他手段结合才能到达,这个是未来需要去探索的。


另一方面,大模型的能力已经到了一定的高度,具备了逐渐向某些行业去渗透的条件,很多机构也会逐渐将模型结合工具调用能力、交互能力、计划决策的能力,逐渐探索向各个行业去落地的可能性。


“我相信这些探索能够将大模型真正从去年能力的展现,变成真正能变革生产力的一个工具,我觉得这两方面今年都会有巨大的竞争。”林达华说。


在发布会现场,徐汇区委常委、副区长俞林伟表示,对于2024年,他较为关注的方面是,美国能不能够逼近真正的通用人工智能、大模型的“iPhone时刻”什么时候能够到位,以及,中国的大模型谁先能够逼近OpenAI的GPT-4。


俞林伟谈到,在和行业交流时他发现,大家普遍认为GPT-4是主力应用的起点,要做真正的垂类市场闭环应用,必须以GPT-4作为能力的起点,“所以对我们来说,能不能在2024年实现突破,谁能率先跑过这根线我觉得很重要。”


微信编辑 | 立早

推荐阅读

日本突发!福岛发生集体食物中毒事件



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
打通大模型训练任督二脉!国内首个千亿参数、全面开源大模型来了,还联手开发者共训德国常被称为“欧洲的妓院”千元成本搞定专业大模型,系统优化+开源大模型是关键 | 潞晨卞正达@MEET2024【周末综艺会10期】— 我拍的荷花我们是建筑师,但我们想做的不仅是建筑|​dtl指明研究室AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布《僭越之殇》(26)灵灵Q的三世轮回北京内推 | 阿里淘天集团招聘大模型/多模态大模型算法实习生数字化+私域,食饮酒水行业找到转型突破口出国旅,在离美之前最好要做的一件事GPT又迎重磅升级!万物皆可大模型(赠大模型系列课程+书籍)腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法大模型也有小偷?为保护你的参数,上交大给大模型制作「人类可读指纹」这世界是个草台班子,但我们不是,我们将捍卫每一个明天免费《大模型应用实践》实训营第二周课程来啦!这次百度算法工程师团队手把手教你构建大模型应用,另有第一周干货回顾!"欧洲在告诉匈牙利,你们可能有手枪,但我们有火箭筒"传字节成立AI应用新部门Flow;淘天集团筹建大模型团队;浪潮信息开源千亿级大模型丨AIGC大事日报今日arXiv最热大模型论文:清华把大模型用于城市规划,回龙观和大红门地区成研究对象AI早知道|自定义ChatGPT商店下周上线;腾讯推出语音识别大模型;美图大模型上线今日arXiv最热NLP大模型论文:北京大学警惕ChatGPT等大模型遏制人类的创新能力台积电高歌猛进,这家厂商最惨2024年或成国产大模型应用爆发年!有道再推多款大模型产品及应用【动脉严选新品鉴第37期】百度灵医大模型:国内首个产业级医疗大模型AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 Debug明天你是否依然爱我---美中的小蜜月李国庆离婚了,但我们还是恭喜俞渝吧苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型我们离下一次金融危机还有多远?复旦留美流浪博士真的有病,但我们也病得不轻突飞猛进!3家外商独资公募完成产品"首秀",2024年看好这些机会今日Arxiv最热NLP大模型论文:复旦大学最新研究,如何让大模型说出“我不知道”?清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!2023创业家年会关键词是“AI”;百度发布Q3财报;拼多多成立大模型团队;字节飞书接入大模型;比尔·盖茨最新分享多题材可选!带你了解青春剧的类型突破思路AI不跑分|国内外七款大模型,哪款是真正的训猫大师?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。