Redian新闻
>
智谱 AI 推出新一代基座大模型 GLM-4,能力逼近 GPT-4,配备多模态、长文本和智能体

智谱 AI 推出新一代基座大模型 GLM-4,能力逼近 GPT-4,配备多模态、长文本和智能体

科技


最接近 OpenAI 的中国追赶者,拿出了逼近 GPT-4 的超强大模型。


作者 | 连冉
编辑 | 郑玄

1 月 16 日,智谱 AI 在其首届技术开放日(Zhipu DevDay)正式发布了新一代基座大模型 GLM-4。

据智谱 AICEO 张鹏介绍GLM-4 的整体性能相比上一代大幅提升,逼近 GPT-4。它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。

除此之外,GLM-4 大幅提升了智能体能力,GLM-4 All Tools 实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter 代码解释器和多模态文生图大模型以完成复杂任务。GLMs 个性化智能体定制功能亦同时上线,用户用简单的提示词指令就能创建属于自己的 GLM 智能体。

演讲中,张鹏回顾了大模型行业和智谱 AI 过去五年的发展历程。他坦言,由于起步晚、算力受限等因素的制约,今天国内大模型与国外最先进的团队还有将近一年的差距。张鹏没有回避智谱 AI 依然是「追赶者」的事实。而拿出性能非常逼近 GPT-4 的 GLM-4,智谱 AI 已经践行了自己去年年初定下的承诺。


01

GLM-4:

多模态、长文本、智能体 


智谱 AI 表示,此次发布的 GLM-4,在多个评测集上性能已接近或超过 GPT-3.5,个别项目上几乎持平 GPT-4。其中以下四个能力更新,是 GLM-4 最大的亮点:
  • 多模态能力:推出了 CogView3 代,效果超过开源 SD 模型,逼近 DALLE-3。

  • All Tools 能力:GLM-4 能自主理解复杂指令,自由调用 WebGLM 搜索增强、Code Interpreter 代码解释器和多模态生成能力,完成复杂任务。

  • GLMs 个性化智能体定制:用户可以通过智谱清言官方网站创建属于自己的 GLM 智能体,无需编程基础。

  • MaaS 平台和API:GLM-4 登陆了 Maas 平台,提供 API 访问,支持开发者内测 Assistant API。

具体来说,GLM-4 可以支持 128k 的上下文窗口长度,单次提示词可以处理的文本可以达到 300 页。同时,在 needle test(大海捞针)测试中,128K 文本长度内 GLM-4 模型均可做到几乎 100% 的精度召回,并未出现长上下文全局信息因为失焦而导致的精度下降问题。同时,多模态能力方面,文生图和多模态理解都得到了增强。
GLM-4 多模态能力展示| 图片来源:智谱 AI
此外,GLM-4 的 All Tools 能力全新发布。得益于 GLM 模型的强大 Agent 能力,GLM-4 实现了自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter 代码解释器和文生图 CogView3 模型。
同时,GLM-4 通过代码解释器,会自动调用代码解释器进行复杂的方程或者微积分求解。对比 GSM8K、Math 以及 Math23K 三个数据集上的结果,GLM-4 All Tools 取得和 GPT-4 All Tools 相当的效果。GLM-4 的 All Tools 能力完全自动,而且可以处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。
为降低大模型使用门槛,GLMs 个性化智能体定制能力也同步上线。基于 GLM-4 模型的强大能力,用户只要登录智谱清言官方网站,用简单的提示词指令就能创建属于自己的 GLM 智能体。
并且,用户可以通过全新上线的智能体中心分享自己创建的各种智能体。GLM 模型智能体的推出,标志着任何人都能够自由运用 GLM-4 模型并挖掘它的潜力,即使没有任何编程基础,也能够实现大模型的便捷开发,这也是扩大大模型开发者社区生态的一次进步。
这个功能一经推出,就在行业内引起热议。去年 11 月 OpenAI 推出 GPTs 以来,智能体已经成为当下大模型赛道最热门的落地方向,也被认为是打造大模型行业生态的重要基石。
此前,智谱 AI 分别联合 CCF 中国计算机学会、中国中文信息学会社会媒体处理专委会发起了 CCF-智谱大模型基金、SMP-智谱大模型交叉学科基金,用于支持大模型理论、算法、模型、应用等相关研究和跨领域交叉创新。
去年,两支基金为来自全国三十余所高校参与的 41 个研究项目累计提供了超 1000 万元现金和算力资源的科研支持。
2024 年,智谱AI也将发起开源开放的大模型开源基金,该计划包括三个「一千」:
  • 智谱 AI 将为大模型开源社区提供一千张卡,助力开源开发;

  • 提供 1000 万元的现金用来支持与大模型相关的开源项目;

  • 为优秀的开源开发者提供 1000 亿免费 API tokens。

张鹏表示,大模型开源基金的目的在于推动大模型研发的大进展,促进大模型整个开源生态的大繁荣。面对全球的大模型创业者,智谱 AI 也将「Z 计划」进一步升级,联合生态伙伴发起总额 10 亿人民币的大模型创业基金用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。

02

2024 年是 

AGI 元年,但路还长 


在上午的演讲中,智谱 AI CEO 张鹏谈到,大模型是当前人工智能研究和应用的热点,被认为是通向通用人工智能的关键途径,也是国际科技竞争的焦点。从 2017 年的 Transformer 架构,到 BERT、GPT 系列等模型的推出,这些年来,大模型在算法创新、模型规模和应用领域都取得了显著进步,刚刚到来的 2024 年是 AGI 元年,但路还很长。
在演讲中,张鹏回顾了大模型行业和智谱,在过去 5 年的发展历程:
智谱 AI CEO 张鹏 | 图片来源:智谱 AI

2018-2020:

大模型的算法创新年

2017 年,谷歌提出了 Transformer 机器学习模型架构,迅速席卷了整个人工智能研究领域,成为自然语言处理等相关研究的主要方法,2018 到 2020 年,业内先后出现了 BERT、GPT/GPT-2/GPT-3、T5 等基于大规模无标注数据自监督学习的大规模预训练算法,可以说 2018-2020 年是大模型的算法创新年,在这段时间,智谱 AI 研发了属于自己的算法 GLM。

2020-2022 年:

模型之争开始

2020 到 2022 年,模型之争开始,基于各种预训练模型框架和开源项目,各种模型如雨后春笋般诞生。2020 年的 GPT-3,拥有 1750 亿参数,可以被视作这一战的起点,它开启了基座模型的全新时代,其在语言生成、上下文学习和知识理解等方面展现出惊人能力。
随后全球范围内掀起了一股大模型研究和研发的热潮,谷歌、Meta 等国际领先公司开始不断发布百亿到千亿规模的大型语言模型,例如 Gopher(2021 年)、Chinchilla(2022 年)、PaLM(2022 年)、Claude(2022 年)等等,但是这些模型都不开源,因此开源大语言模型也开始受到关注,比如 META 的 OPT(2022 年)、BLOOM(2022 年)、LLAMA(2023 年)。
智谱 AI 则选择在 2022 年开源了自己的千亿基座模型 GLM-130B,这一工作引起了全世界范围的关注,包括顶尖高校斯坦福,还有公司 google、OpenAI、apple、meta 都对智谱 AI 的模型进行了深入分析和对比。

2023 年:

大模型出圈

2023 年,ChatGPT 推出后,大模型开始火出圈,被公众广为所知。大模型的发展不再仅限于模型的训练,更重要的是如何实现模型的产业化应用落地,大模型开始在各个领域开花并且结果。
智谱 AI 在 2023 年这一年当中基于 GLM-130B 研发了 ChatGLM,历经 3 个版本的迭代,逐步具备了多模态理解、代码解释、网络搜索增强等新功能。随后智谱 AI 联合合作伙伴,在一年来实现了广泛的商业应用落地。
在回顾完过去 5 年来大模型的发展后,张鹏也总结称必须承认的一点是,和国外大模型相比,国内的大模型发展起步晚一些,加上高性能算力的限制和数据质量的差距等等,国内研发的大模型无论规模还是核心能力,与世界先进水平还存在一年左右的差距。
去年年初智谱 AI 承诺,「2023 年底智谱 AI 要实现逼近最先进的 GPT-4 性能的全栈自主创新的 GLM-4」,作为一年前定下的目标,今天可以看到,GLM-4 性能已得到明显的提升,而「从标准的大模型评测角度看,整体上我们已经逼近了 GPT-4」。

*头图来源:智谱
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO


极客一问
国产大模型里,
你最看好哪个



 

热点视频

刚刚发布的小米新一代机器狗「铁蛋2」都掌握了哪些新技能?来看看雷军在发布会现场是怎样介绍的。

点赞关注极客公园视频号
观看更多精彩视频

 

更多阅读




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
GLM-4国产大模型上线 称整体性能逼近GPT-4 降低推理成本「国家队」入局,多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资国产 GTPs 上线!智谱 AI 推出 GLM-4 全家桶,我们浅试了一下GPT-4抽象推理PK人类差距巨大!多模态远不如纯文本,AGI火花难以独立燃烧有感又一则国产「GPTs」上线!全面对标 OpenAI 的智谱发布大模型,性能逼近 GPT-4全面对标OpenAI生态!智谱AI推出GLM-4大模型全家桶,GLMs上线,不会编程也能创建Agent国产GPTs来了,基于智谱第4代大模型!模型性能均达GPT-4九成以上说一个有关Open AI的Chat GPT 创投人和我家的小故事开源AGI智能体人人可养成:AGI对齐新思路,让智能体在人类世界中接受训练腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法比肩GPT-4,商汤日日新大幅升级4.0,多模态能力领先一步chat gpt 怎么上不去了? 彻底罢工了骁龙888实时运行,美团、浙大等打造全流程移动端多模态大模型MobileVLM清华大学与智谱 AI 联合推出 CogAgent:基于多模态大模型的 GUI Agent,具备视觉问答、视觉定位等能力我们为什么不够自知之明,又该如何认清自己?AI早知道|ChatGPT模型大更新;阿里云发布多模态大模型;百度推多模态模型UNIMO-G杭州/北京内推 | 阿里达摩院多模态团队招聘多模态方向全职研究员/实习生ICLR 2024 | 媲美DALLE-3!基座模型LaVIT刷榜多模态理解与生成任务红色日记 糊涂观念 3.1-31今日Arxiv最热NLP大模型论文:LLM化身符号逻辑大师,智能体文本游戏新纪元AI早知道|同花顺推出问财大模型;Midjourney将推文本转视频模型;谷歌即将推出Bard Assistant​AAAI 2024 | 首个多模态实体集扩展数据集MESED和多模态模型MultiExpan匿名论文提出奇招!增强大模型长文本能力居然还能这么做北京内推 | 阿里淘天集团招聘大模型/多模态大模型算法实习生GPT-4V惨败!CV大神谢赛宁新作:V*重磅「视觉搜索」算法让LLM理解力逼近人类性能直追GPT-4,5000个H100训成!DeepMind联创发全新一代大模型智谱AI推出新一代基座模型GLM-4,发起大模型开源基金挥舞起代码语料的魔杖,大模型和智能体将召唤出更强大的能量骁龙888实时运行!美团&浙大等打造移动端多模态大模型MobileVLM丈夫管钱孜孜不倦 老婆要离方知缺陷AI早知道|知网推出AI写作选题;智谱AI发布大模型GLM-4;华为开源GenImage数据集刚刚开源!中科大提出利用GPT4-V构建大规模高质量图文数据集ShareGPT4V,助力模型霸榜多项多模态榜单!GPT独家对话智谱:开源的大模型越来越多,但智谱选择慢慢来GPT-4V只能排第二!华科大等发布多模态大模型新基准:五大任务14个模型全面测评宾州波科诺(Pocono),红白相托超越GPT-4,Google发布大模型Gemini/苹果明年初或将推出多款新品/五月天阿信回应假唱风波
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。