Redian新闻
>
真要这么卷?某国产大模型定价下调90%,百万 tokens 只需 1 元!

真要这么卷?某国产大模型定价下调90%,百万 tokens 只需 1 元!

公众号新闻
 夕小瑶科技说 原创
 作者 | 夕小瑶编辑部

就在刚刚,国内明星AI公司——智谱AI官宣重磅炸弹:

将能力对标GPT3.5-Turbo的GLM-3的大模型API调用价格最高下调90%,价格仅为原来的十分之一!

废话不多说,直接上图:

官网地址:https://open.bigmodel.cn/

一句话解释:在不使用Batch API的情况下,GLM-3 Turbo的模型定价降80%;在使用Batch API的情况下,价格再额外减半,达90%降幅!

即将推出的GLM-3 Turbo Batch 批处理 API(异步任务处理),适用于无需实时响应场景,包括效果评估、数据批处理等任务。

与GLM-3能力接近的主流国产大模型还有百度文心一言ERNIE-3.5、阿里通义千问Qwen-Turbo,这几个都是能力对标GPT3.5的国产大模型。

很多人可能对GLM-3 Turbo降价后的1元=200万tokens没什么概念,笔者给大家上了个直观的大模型价格对比图:

可以看到,智谱GLM-3 Turbo的新定价相比其他几家能力相近的模型,简直是低到冷人发指,就差把免费二字贴到脑门上了。

如果你是个小红书博主,平均每篇小红书笔记360字,那么你给GLM-3 Turbo充值 1块钱,你可以写 10000篇 小红书推文...

你能坚持日更的话,得发27年才能把这一块钱花完

ps:对于小红书推文来说,亲测GLM-3 Turbo能力够用了

今天这一刻让笔者恍惚间回到了若干年前的滴滴Uber补贴大战,亦或是更早的外卖补贴大战,面临今天这似曾相识的一幕,笔者心里只有一个声音:

打起来!打起来!

好了,严肃,聊点认真的。

作为AI从业者,笔者深知大模型价格大幅下降所带来的意义有多恐怖。而智谱作为国产大模型技术的领军厂商,率先打响第一枪,放在若干年后回头看,这很可能成为一个里程碑事件。

Sam Altman在一次采访中提到:

“高质量的人工智能的成本会越来越便宜,将持续降低到接近于0”

大模型技术,若要深刻的改变世界,意味着它具备影响全球十亿人的影响力。而要影响全球十亿人,意味着大模型技术的访问成本要足够低,才能支撑起来繁荣、强网络效应的上层应用。

智谱AI的这一枪,让国内的AI产业链比国外更早的迈入“超低成本构建上层AI应用”的时代。尽管国内的大模型基础技术没有国外成熟,但价格却率先卷了下来,这意味着国内在AI应用生态上,有望比国外更早的出现免费的现象级AI应用。

接下来,就得看智谱的友商的表现了。

看到这,你可能会问,为什么是智谱AI打响了价格战第一枪?

这还得从夕小瑶科技说前阵子发表的这篇文章《网传Llama 3比肩GPT-4?别闹了》 说起。

智谱AI此次降价,既不是有钱任性、也不是拼命,而是因为——

技术实力够强所带来的“任性”

笔者通过调研发现,智谱AI研发了一系列的模型推理算子优化、模型压缩及硬件高效适配、高性能系统实现以及精细化集群调度等技术,全链路技术优化下,大幅压缩了GLM-3 Turbo的推理成本。

提一个比较恐怖的数字。

自大模型开放平台上线以来,在模型效果和推理性能不断提升的情况下,据粗略估算,模型的调用价格已累计降价超过100倍

智谱AI大模型开放平台是智谱GLM系列大模型的体验与接入平台,智谱大模型全家桶包括GLM-3-Turbo、GLM-4、视觉理解大模型GLM-4V、文生图模型CogView-3、代码模型 CodeGeeX 、超拟人角色定制模型CharacterGLM,擅长中文的向量模型Embedding-2等,几乎涵盖大模型应用开发的所有场景。

平台传送门:https://open.bigmodel.cn/

在这个恐怖的数字背后,是智谱AI持续的技术创新和积累,从底层算法、预训练框架、到国产硬件适配,GLM系列模型全链路技术不仅安全可控,且已比肩世界先进水平。

笔者深入研究了智谱AI大模型开放平台后发现,bigmodel.cn 上已经聚集了超过数十万的企业和开发者,并且在持续快速增长,过去的半年每日tokens消耗增长超过一百倍

它不仅拥有完整的商业化套件,甚至还提供开箱即用的AI应用开发资源和官方的调用工具,比如:

  • 网页检索web search
  • 函数调用function call
  • 知识库检索retrival

这些工具自1月份上线以来已被累计调用超 3亿次

目前,智谱AI大模型开放平台形成了强大的大模型技术与应用共济生态。

最后,不得不再提一嘴智谱AI领跑业界的技术实力。

在刚刚结束的ICLR2024顶级会议上,智谱AI成为了唯一一家受邀演讲的中国AI厂商,分享了GLM大模型面向AGI的三大技术趋势:

  1. 基于超级认知SuperIntelligence和超级对齐SuperAlignment技术的GLM-4升级版本,在多模态和AI安全方面有很大提升;
  2. 提出以大模型为中心的通用计算系统GLM-OS,目的是解决复杂任务;
  3. 公开了正在探索中的GLM-Zero技术项目,模仿人类的无意识的学习机制,这将是通过AGI必经之路。

在这次演讲中,智谱还透露了一个重要信息:

接下来GLM-4.5会迎来文本能力和多模态能力的升级!

又是卷起价格战,又是在AI顶级会议上受邀演讲,甚至还有这即将到来的GLM“旗舰模型”的重磅升级。智谱AI的这一系列操作已经把国内广大AI开发者的期待值拉满了!

话不多说,flag当立。

等出来后,小编我第一时间给大家测评!

参考资料

[1]https://open.bigmodel.cn/
[2]https://cloud.baidu.com/doc/WENXINWORKSHOP/s/hlrk4akp7
[3]https://help.aliyun.com/zh/dashscope/developer-reference/tongyi-thousand-questions-metering-and-billing?spm=a2c4g.11186623.0.0.2ac146c1lShF3p
[4]https://blog.iclr.cc/2024/04/15/announcing-iclr-2024-invited-speakers/ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
5大维度21项细分能力拿下国产大模型首位,文心一言还是那个老大日本亲子游这么卷?富士山露营、花火、泡温泉,一问价格我消费观崩了……打工人、宝妈、学生党都能用上大模型?6款国产大模型实用性测试LongRoPE:超越极限,将大模型上下文窗口扩展超过200万tokens国产大模型降价潮大模型价格进入“厘”时代,豆包大模型定价每千tokens仅0.8厘最神秘国产大模型团队冒泡,一出手就是万亿参数MoE,两款应用敞开玩百亿token免费用!国产平台一键拖拽定制大模型,多元算力极具性价比博主发文的真实和虚假国产大模型问鼎AIGC第一股!连续2年盈利,营收10个亿中文得分世界第一,多项盲测并肩 GPT4o,这个国产大模型怎么就成了 AI 界的黑马?房前华盛顿山楂树四、北美红雀觅食篇click bait flow n numbers up (ZT)美国封锁开源AI!国产大模型还能卷多久?国产大模型评测超GPT-4!李开复:十年内不会套现国产大模型:今天起,我们100万tokens只需1元!堪忧未来-美撒开科幻级战争大网百万tokens低至1元!大模型越来越卷了性能超越 GPT-4 Turbo!「商汤日日新」大升级,国产大模型超市开张了今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事国产大模型卷翻机器人!这些火遍全网的机器人,都装上了星火「大脑」国产大模型的价格已经卷出网约车大战和百亿补贴的味儿了老便宜了!字节跳动豆包大模型开始营业,一元钱能买125万Tokens,月活用户量达2600万谷歌7大模型22项AI大招轰炸:70秒视频生成、Gemini安卓合体、200万tokens上下文名人应不应该有隐私--从英国凯特王妃P照片说起别再说国产大模型技术突破要靠 Llama 3 开源了腾讯大模型APP真实测评!七家国产大模型“battle”,元宝顶得住吗?GPT-4 Turbo首次被击败!国产大模型拿下总分第一击穿全网底价,通义千问GPT-4级大模型直降97%!1块钱能买200万tokens震撼!GPT-4 Turbo级国产大模型登场,周冠宇F1赛事数据秒分析惊呆国际大佬抖音豆包成年轻人AI顶流!字节跳动大模型家族登场,tokens价格比行业低99%大神Karpathy强推,分词领域必读:自动钓鱼让大模型“发疯”的token,来自Transformer作者创业公司斯坦福团队抄袭国产大模型,面壁智能创始人:受到国际认可/百度被《时代》周刊评为全球领导者/特斯拉回应「单踏板模式被禁」传言国产大模型Kimi爆火,公司为宕机致歉,记者实测→
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。