Redian新闻
>
百万tokens低至1元!大模型越来越卷了

百万tokens低至1元!大模型越来越卷了

公众号新闻

机器之心原创

作者:吴昕

入门价格越来越便宜了。
在刚刚举行的 ICLR 2024 大会上,智谱AI的大模型技术团队公布了面向激动人心的AGI通用人工智能前景的三大技术趋势,同时预告了GLM的后续升级版本。


今天,智谱大模型开放平台(bigmodel.cn)上线了新的价格体系。入门级产品 GLM-3 Turbo 模型调用价格下调80%!从5元/百万tokens降至1元/百万tokens。1元可
以购买100万tokens。


调整后,使用GLM-3 Turbo创作一万条小红书文案(以350字计)将仅需约1元钱,足以让更多企业和个人都能用上这款入门级产品。

来自智谱AI开放平台官网


除了降价,官方还特别提供用户 tokens 优惠计划——从今天起,新注册开放平台用户赠送额度提升500%。开放平台新注册用户获赠从500 万tokens提升至2500万tokens(包含2000万入门级额度和500万企业级额度)。

GLM-3 Turbo(最大支持 128k)是大模型开放平台最受欢迎的模型产品,不仅速度快,而且适用于对知识量、推理能力、创造力要求较高的场景,此次调价后更具竞争力,国内其他128k级别大模型的调用价格大多从百万tokens数元到几十元不等。

企业级产品 GLM-4/GLM-4V 价格仍维持在 0.1元/千 tokens,百万tokens的价格为100元,但作为一款能力逼近GPT-4的国内领先大模型,这一价格还是比较能打。从公开的API 调用收费来看,OpenAI 最新模型 GPT-4 Turbo 每100万tokens输入/输出价格分别是10/30美元。Claude 3 Opus 更贵,每百万tokens输入/输出价格15/75美元。如果折合成人民币,这些数字至少还要乘以7。



SuperBench榜单:GLM-4超过GPT-4系列模型位居第二


对于开发者和企业来说,模型的使用成本是一个重要考量,大模型降价有利于吸引更多的开发者和企业客户,扩大其生态圈。华福证券最近发布报告称,大模型成本优化与算力需求并不是直接的此长彼消,而是互相搭台、相互成就。定价的持续走低有望带来更快的商业化落地,进而会衍生出更多的微调及推理等需求,将逐步盘活国内AI应用及国产算力发展。

这次 API定价更新也体现出智谱AI覆盖开发者用户的决心——单次调用适合对实时性要求高的中小用户;批量调用定价更低,则是为数据量大、对成本敏感的企业及用户量身定制。作为国内应用最为广泛的开放平台,智谱的开放平台上已经聚集了超过数十万的企业和开发者,并且在持续快速增长,过去的半年每日的token消耗增长超过一百倍。比如官方开发的三个调用工具,网页检索、函数调用以及知识库,自从1月上线以来调用次数已经超过 3 亿次。


技术的进步也为降低开发、运行 LLMs 成本提供了现实可能。例如,从基础设施来看,随着一些老款AI芯片(比如 Nvidia A100 )降价,大模型培训成本下降了约60%。英伟达也优化了软件性能,帮助开发者更快训练和运行大模型。研发人员也在模型架构、模型压缩以及GPU调用等方面探索到一些降本增效的办法。


智谱曾表示,通过模型推理算子优化、模型压缩及硬件高效适配、高性能系统实现以及精细化集群调度等技术将 GLM-3 Turbo的推理成本压缩到1/5。自大模型开放平台上线以来,在模型效果和推理性能不断提升的情况下,已累计降价超过百倍。

除了降价,智谱AI还宣布包括GLM-3 Turbo 以及最先进基座大模型GLM-4在内的GLM系列模型也将迎来更新,目前正在灰度测试中,很快将和广大开发者和应用者见面。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
爆胎以後的流水帳美股基本面 - 2024_03_12 * 晚报 * 美国核心通胀高于预期 市场仍预测6月最可能降息 欧洲股指创新高 丰田成亚洲《阴阳鱼》连载第42章:时间如刀,空间如砧板,而你我都不过是鱼肉真要这么卷?某国产大模型定价下调90%,百万 tokens 只需 1 元!LongRoPE:超越极限,将大模型上下文窗口扩展超过200万tokens大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事这才是今年夏天该入手的神器好物!降温超快,还是空调好搭档,低至1.2W,整夏不到“1元”钱T100比赛,pro们惊人的实力79.9元7件!低至11元每件!六一儿童超值福袋速抢,限时限量,手慢无~三星噩耗:1周开始上6天班!越来越卷了?AI越来越卷,如何走出一片天?快来阿里巴巴-南洋理工联合实验室大神Karpathy强推,分词领域必读:自动钓鱼让大模型“发疯”的token,来自Transformer作者创业公司一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo谷歌7大模型22项AI大招轰炸:70秒视频生成、Gemini安卓合体、200万tokens上下文老便宜了!字节跳动豆包大模型开始营业,一元钱能买125万Tokens,月活用户量达2600万谷歌这次又“杀疯了”!200万token长文本能力问鼎全球最强,一场大会,AI被提了120次抖音豆包成年轻人AI顶流!字节跳动大模型家族登场,tokens价格比行业低99%35家伦敦中餐外卖满£15减£10!Veja/Bao Bao三宅一生大促半价!Clarks低至2折!大模型价格进入“厘”时代,豆包大模型定价每千tokens仅0.8厘单卡A100实现百万token推理,速度快10倍,这是微软官方的大模型推理加速今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理月供本金低至1元!还有银行最长可10年不用还本金......多家银行推房贷“先息后本”!划算么?算笔账后发现→当我学会“多巴胺教育”,终于让孩子学习越来越主动,越来越自律击穿全网底价,通义千问GPT-4级大模型直降97%!1块钱能买200万tokens为什么养孩子会越来越卷?百万token上下文窗口也杀不死向量数据库?CPU笑了1959-1961 famine predisposed on diabetes...背后“金主”超50家的杨幂新剧,开播仅5分钟就有人卖“高清资源”,价格低至1元多!《庆余年2》《新生》也没能幸免......公立国际部 vs 老牌国际校,北京留学赛道正在越来越卷?英国汉堡王人气新品买一送一!Boots低至4.5折,Gucci全场7折越来越卷的粽子江湖,满馅云南粽是主流?加快410倍!字节豆包新工作TiTok:全新图像Tokenizer!生成图像最低只需32个token越来越卷了!老牌科技巨头开始倒逼高管层一周上六天班!【社会】法国人结婚越来越晚,结婚的人也越来越少国产大模型:今天起,我们100万tokens只需1元!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。