Redian新闻
>
阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens!

阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens!

公众号新闻
整理 | 褚杏娟

5 月 21 日,阿里云抛出重磅炸弹:通义千问 GPT-4 级主力模型 Qwen-Long,API 输入价格从 0.02 元 / 千 tokens 降至 0.0005 元 / 千 tokens,直降 97%。这意味着,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入,降价后约为 GPT-4 价格的 1/400,击穿全球底价。

Qwen-Long 是通义千问的长文本增强版模型,性能对标 GPT-4,上下文长度最高达 1 千万。除了输入价格降至 0.0005 元 / 千 tokens,Qwen-Long 输出价格也直降 90% 至 0.002 元 / 千 tokens。

相比之下,国内外厂商 GPT-4、Gemini1.5 Pro、Claude 3 Sonnet 及 Ernie-4.0 每千 tokens 输入价格分别为 0.22 元、0.025 元、0.022 元及 0.12 元,均远高于 Qwen-long。

通义千问本次降价共覆盖 9 款商业化及开源系列模型:

  • 通义千问商业化模型:Qwen-Turbo、Owen-Plus、Qwen-Long、Qwen-Max;

  • 通义千问开源模型:Qwen1.5-7B、Qwen1.5-14B、Qwen1.5-32B、Qwen1.5-72B、Qwen1.5-110B。

其中,不久前发布的通义千问旗舰款大模型 Qwen-Max,API 输入价格降至 0.04 元 / 千 tokens,降幅达 67%。Qwen-Max 在权威基准 OpenCompass 上性能追平 GPT-4-Turbo,并在大模型竞技场 Chatbot Arena 中跻身全球前 15。

业界普遍认为,随着大模型性能逐渐提升,AI 应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。

“公共云 +API”企业大模型
主流应用方式

在武汉 AI 智领者峰会现场,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速 AI 应用的爆发。我们预计未来大模型 API 的调用量会有成千上万倍的增长。”

刘伟光认为,不管是开源模型还是商业化模型,公共云 +API 将成为企业使用大模型的主流方式。

首先,公共云的技术红利和规模效应,带来巨大的成本和性能优势。

刘伟光介绍,阿里云可以从模型自身和 AI 基础设施两个层面不断优化,追求极致的推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络 HPN7.0、高性能存储 CPFS、人工智能平台 PAI 等核心技术和产品,构建了极致弹性的 AI 算力调度系统,结合百炼分布式推理加速引擎,大幅压缩了模型推理成本,并加快模型推理速度。

即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用 Qwen-72B 开源模型、每月 1 亿 tokens 用量为例,在阿里云百炼上直接调用 API 每月仅需 600 元,私有化部署的成本平均每月超 1 万元。

其次,云上更方便进行多模型调用,并提供企业级的数据安全保障。

刘伟光表示,阿里云可以为每个企业提供专属 VPC 环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与 10 多项大模型安全相关国际国内技术标准的制定。

最后,云厂商天然的开放性,能为开发者提供最丰富的模型和工具链。

刘伟光表示,阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama 系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建 RAG 等应用。从选模型、调模型、搭应用到对外服务,一站式搞定。

报告推荐

AGI 概念引发热议。那么 AGI 究竟是什么?技术架构来看又包括哪些?AI Agent 如何助力人工智能走向 AGI 时代?现阶段营销、金融、教育、零售、企服等行业场景下,AGI 应用程度如何?有哪些典型应用案例了吗?以上问题的回答尽在《中国 AGI 市场发展研究报告 2024》,欢迎大家扫码关注「AI 前线」公众号,回复「AGI」领取。

 活动推荐

本届 ArchSummit 会议上,重点聚焦 AI 大模型技术在各行业的落地实践, 顺丰集团、众安银行、天弘基金、鸿海科技集团、宁德核电、广发证券、微众银行介绍大模型技术的应用效果 。会议上还设置了大模型应用、架构升级、智算平台、AI 编程、成本优化等专题和话题内容。如您感兴趣,可点击「阅读原文」查看更多详情。目前会议进入 9 折购票阶段,可以联系票务经理 17310043226 , 锁定最新优惠。


今日荐文


26岁带着百人团队冲刺大模型,面壁智能天才CTO:高效比参数更重要


OpenAI 联创 Ilya 离职内幕曝光;微软中国AI团队集体打包去美国?最新回应;华为回应大模型发布会演示造假 | AI周报


AICon 2024 重磅开幕!60 余位大咖干货集结:20 年来云首次革命性变化、大模型才刚刚开始……


老便宜了!字节跳动豆包大模型开始营业,一元钱能买125万Tokens,月活用户量达2600万

OpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型

你也「在看」吗?👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型持基超1240亿! “顶级主力”中央汇金买入大盘点一块钱100万token,超强MoE模型开源,性能直逼GPT-4-TurboAI早知道|阿里云发布通义千问2.5;xAI 估值将约达180亿美元阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024“我在拼多多上拼外教课,3000块钱200节课......”余承东透露江淮合作新车型,对标劳斯莱斯/微软生成式 AI 开发中心支持 GPT-4o /阿里云、百度主力模型价格大降/英伟达市值一天暴涨1.6万亿,黄仁勋身家超6000亿;阿里降价97%、百度宣布免费,AI大模型价格战“杀疯了”丨AI周报北京内推 | 阿里通义实验室对话智能团队招聘大语言模型研究型实习生多幸运,我有个我们微软开发者大会发布50多项更新;阿里披露对月之暗面的投资详情;通义千问主力模型降价97%|AIGC周观察第四十四期Kimi、通义千问、Claude“变身”马斯克,它们这样评价雷军大雪纷飞击穿全网底价,通义千问GPT-4级大模型直降97%!1块钱能买200万tokens苹果罕见为广告道歉,撤回新 iPad 宣传视频/小米同意为开 39 公里故障车主换车/阿里发布通义千问 2.5通义千问开源王炸,1100亿参数称霸开源榜单,中文能力全球第一如何看待OpenAI最新发的ChatGPT-4o?文心一言、通义千问回答OpenAI CEO最新演讲:GPT-5性能远超GPT-4;媲美Sora,视频生成模型EMO上线通义APP丨AIGC日报杀疯了!全面超越Llama3的强悍开源模型,仅9B,1000k上下文;GPT-4级别模型1年降价1万倍阿里通义千问 GPT-4 级主力模型降价 97%,百度文心两大模型全面免费上海生死签证:十七岁犹太少年与何凤山“寡姐”斯嘉丽称OpenAI未经同意刻意模仿其声音;阿里云宣布通义千问主力模型降价97%丨AIGC日报英伟达一季净利暴增 6 倍,AI 芯片年更;王小川、李开复拒绝跟进大模型降价;ChatGPT 可引用多家报纸内容 | 极客早知道阿里通义千问2.5大模型发布;阿里达摩院提出“知识链”框架,逐步纠错降低大模型幻觉丨AIGC日报百度宣布文心大模型两大主力模型全面免费通义千问 2.5 发布,成为中国最强开源大模型全面赶超GPT-4 ?阿里云发布通义千问2.5【詩評】红玫寂无主小米汽车27分钟大定超50000台,雷军称发布会前一天降价3万/通义千问将接入多款Android手机/百度沈抖回应与苹果合作我的家世AI早知道|B 站开源轻量级 AI 语言模型;阿里通义Qwen2成最强开源大模型GPT-4调教指令揭秘,OpenAI又「Open」了一回!网友在线追问GPT-5巨头杀疯了!阿里:降价97%!百度“王炸”:免费!创业公司怎么办?李开复表态华为相关人士辟谣P70预售,苹果或用百度人工智能,通义千问可处理千万字文档,微信回应朋友圈横线,这就是今天的其他大新闻!开源超闭源!通义千问Qwen2发布即爆火,网友:GPT-4o危
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。