Redian新闻
>
国产 GTPs 上线!智谱 AI 推出 GLM-4 全家桶,我们浅试了一下

国产 GTPs 上线!智谱 AI 推出 GLM-4 全家桶,我们浅试了一下

公众号新闻

作者 | 褚杏娟

1 月 16 日,智谱 AI 团队全面展示了其投身于大模型事业三年多来所积累的技术成果,并重磅发布了新一代基座大模型 GLM-4。

根据智谱 AI 的介绍,GLM-4 的整体性能相比上一代大幅提升,逼近 GPT-4。 具体包括:支持 128k 的上下文窗口长度,单次提示词可以处理的文本可以达到 300 页;在 needle test(大海捞针)测试中,128K 文本长度内 GLM-4 模型均几乎 100% 的精度召回,并未出现长上下文全局信息因为失焦而导致的精度下降问题等。

在多模态能力方面,我们也进行了尝试:(生成等待时间有点长,我们剪辑了下~)

输入“以智谱 AI 发布大模型为主题,制作一张图片”,最后生成的图片如下:

想看 GML-4 和 GPT-4 对比的“数据党”,可以看如下对比:

GLM-4 在 MMLU(81.5)达到 GPT-4 的 94%;GSM8K(87.6) 达到 GPT-4 的 95%;MATH(47.9)达到 GPT-4 的 91% ;BBH (82.25) 达到 GPT-4 的 99%;HellaSwag (85.4) 达到 GPT-4 的 90% ;HumanEval(72)达到 GPT-4 的 100% 水平。

此外,GLMs 个性化智能体定制能力同步上线。

用简单的提示词指令就能创建属于自己的 GLM 智能体并分享:(等待时间也略长,我们剪辑了下~)

想尝试的朋友可以智谱清言官网:https://www.chatglm.cn/

智谱 AI CEO 张鹏同时表示,GLMs 模型应用商店、开发者分成计划也即将发布。

此外,GLM-4 的 All Tools 能力全新发布。

基于 GLM 模型的 Agent 能力,GLM-4 实现了自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter 代码解释器和文生图 CogView3 模型。

GLM-4 通过代码解释器,会自动调用代码解释器进行复杂的方程或者微积分求解。对比 GSM8K、Math 以及 Math23K 三个数据集上的结果,GLM-4 All Tools 取得和 GPT-4 All Tools 相当的效果。

处理各种任务,比如包括文件处理、数据分析、图表绘制等复杂任务,支持处理 Excel、PDF、PPT 等格式的文件。

2024 年,智谱 AI 也将发起开源开放的大模型开源基金,该计划包括三个“一千”:智谱 AI 将为大模型开源社区提供一千张卡,助力开源开发;提供 1000 万元的现金用来支持与大模型相关的开源项目;为优秀的开源开发者提供 1000 亿免费 API tokens。

张鹏表示,大模型开源基金的目的在于推动大模型研发的大进展,促进大模型整个开源生态的大繁荣。面对全球的大模型创业者,智谱 AI 也将“Z 计划”进一步升级,联合生态伙伴发起总额 10 亿人民币的大模型创业基金用于支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等方向。

已经尝试了 GLM-4 的小伙伴,快来说说你的使用体验呀~

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

预览版“纯血鸿蒙”开放申请,中国开发者要为“四端”体验一致头痛了

挑战 Spark 和 Flink?大数据技术栈的突围和战争|盘点

谷歌放弃毛利率 99%业务:不想用我们的可以免费迁出!上云免费、下云无限“贵”的时代即将结束?

并发王座易主?Java 21 虚拟线程强势崛起,Go & Kotlin还稳得住吗 | 盘点

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
2024机械师春季新品发布会:发布首套星闪超级电竞“全家桶”火星乐园第三部《灰界》第七十三章 风起云涌国产「GPTs」登场!清华系重磅发布GLM-4全家桶,性能可达90% GPT-4国产GPTs来了,基于智谱第4代大模型!模型性能均达GPT-4九成以上冲!KFC全家桶8块吮指原味鸡只要$10,好吃惨了!面试了70家公司,我才放下大厂人的面子NeurIPS 2023 | 全新机械手算法:辅助花式抓杯子,GTX 1650实现150fps推断AI早知道|自定义ChatGPT商店下周上线;腾讯推出语音识别大模型;美图大模型上线智谱 AI 推出新一代基座大模型 GLM-4,能力逼近 GPT-4,配备多模态、长文本和智能体Amazon Bedrock 全家桶升级,推出新的定制和管理工具GLM-4国产大模型上线 称整体性能逼近GPT-4 降低推理成本我用Excel做了一个年会抽奖器,然后老板点了一下……【爱的底线】国产「GPTs」上线!全面对标 OpenAI 的智谱发布大模型,性能逼近 GPT-4清华大学与智谱 AI 联合推出 CogAgent:基于多模态大模型的 GUI Agent,具备视觉问答、视觉定位等能力独家对话智谱:开源的大模型越来越多,但智谱选择慢慢来全面对标OpenAI生态!智谱AI推出GLM-4大模型全家桶,GLMs上线,不会编程也能创建Agent五绝 古树 步韵众诗友屠光绍:美国股市搞了200多年,上市公司8000多家,我们搞了30多年,一下搞到5000多家,我们的退市步伐跟进的不够智谱AI推出新一代基座模型GLM-4,发起大模型开源基金官宣一下,微博小圈子上线![时尚]全天候慢跑 Asics GT-2000 11 GTX 开箱及GT-1000千公里使用感受为你而來第三部《再次成为神》预告片周末随笔比亚迪自制智能化“全家桶”,里面都有什么?试了这个被刷屏的视频AI,我感觉自己被诈骗了。。。AI早知道|知网推出AI写作选题;智谱AI发布大模型GLM-4;华为开源GenImage数据集HTTPS到底是如何保障我们的安全的GPT store上线,我们帮大家测试了一下国产GPTs要来了!字节的AI“扣子”上线!小白也能玩儿!通义千问爆甩开源全家桶!最强720亿参数超车Llama 2,新上视觉模型看图直出代码亚马逊首次公开谈SHEIN:既是对手也是伙伴;1688重仓越南,上线了一个B2B平台丨Going Global首个全面开源的千亿模型来了!源2.0全家桶击破算力限制,代码数学强到发指720亿参数大模型都拿来开源了!通义千问开源全家桶,最小18亿模型端侧都能跑用AI生成微信红包封面,2天赚3000元?我帮大家试了一下,是真的!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。