Redian新闻
>
通义千问 2.5 发布,成为中国最强开源大模型

通义千问 2.5 发布,成为中国最强开源大模型

公众号新闻

在 GPT-4 面世一年多后,不少大模型已经开始跟上 OpenAI 的脚步。今天阿里云的通义千问模型也进化到了 2.5 版本。
在 2.5 版本中,模型在理解力、逻辑推理、指令执行和编程能力方面都有显著提升,分别比上一版本提高了 9%、16%、19% 和 10%,在中文处理能力上,通义千问更是持续保持行业领先地位。
通义还推出了一个拥有 1100 亿参数的开源模型 Qwen1.5-110B,该模型在多个基准测试中超越了 Meta 的 Llama-3-70B 模型。在 HuggingFace 的开源大模型排行榜 Open LLM Leaderboard 上,Qwen1.5-110B 荣登榜首。

HuggingFace开源大模型排行榜

在多个多模态标准测试中,通义千问视觉理解模型 Qwen-VL-Max 的得分超过了 Gemini Ultra 和 GPT-4V,这个模型已经在多家企业中得到了应用。通义千问代码大模型 CodeQwen1.5-7B 在 HuggingFace 的代码模型榜单 Big Code 上也位居首位,这个模型是通义灵码——国内用户规模最大的智能编码助手——的核心。
在过去的一年中,通义发在的文本生成、智能编码、文档处理、音视频理解等能力都处于国产第一梯队。企业客户和开发者可以通过 API 调用、模型下载等方式接入通义,个人用户则可以通过 APP、官网和小程序免费使用通义。
今天,原通义千问 APP 正式更名为「通义 APP」,集成了通义大模型的全套能力,官方称要成为「通情达义」的 AI 助手。
通义是大模型也开源大模型的代表之一,去年 8 月,通义宣布加入开源行列,并迅速推出了多款开源模型。目前,通义开源模型的下载量已经超过 700 万。
为了满足不同场景用户的需求,通义推出了参数规模从 5 亿到 1100 亿的八款大语言模型,包括小尺寸模型如 0.5B、1.8B、4B、7B、14B,以及大尺寸模型如 72B、110B,还有中等尺寸的 32B 模型。此外,通义还开源了视觉理解模型 Qwen-VL、音频理解模型 Qwen-Audio、代码模型 CodeQwen1.5-7B、混合专家模型 Qwen1.5-MoE。
通义 72B、110B 开源模型都曾登顶 Open LLM Leaderboard 榜首。在 LMSYS Org 推出的基准测试平台 Chatbot Arena 上,通义 72B 模型多次进入「盲测」结果全球 Top 10,创造了国产大模型的先例。
阿里云 CTO 周靖人表示:「开发者的反馈和开源社区的生态支持,是通义大模型技术进步的重要助力。未来通义大模型还会持续开源。」
此外阿里云的百炼平台也已从模型开发、应用开发到算力底座实现 2.0 全面升级,更加易用、更加开放,引入更多模型,还率先兼容 LlamaIndex 等开源框架,企业可自由替换能力组件来适配自身系统。
针对当下企业最关注的 RAG 链路,百炼提供灵活开放的企业级检索增强服务,5 到 10 行代码即可搭建 RAG 应用,让大模型拥有「最强外挂」。
2023 年 10 月,阿里云发布了百炼大模型平台,开发者可通过「拖拉拽」5 分钟开发一款大模型应用,几小时「炼」出一个专属模型,把精力专注于应用创新。本次大会上,百炼升级成为阿里云承载云+AI 能力的重要平台,提供一站式、全托管的大模型定制与应用服务。升级后,百炼可以更好支持地大型企业和成熟开发者的需求。
阿里云 CTO 周靖人介绍到:「当下企业应用大模型存在三种范式:一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用,其中最典型的需求是 RAG,以企业数据对大模型进行知识增强。围绕这些需求,百炼打造了模型中心和应用中心,提供最丰富的模型和最易用的工具箱。」
同时,通义灵码宣布推出企业版,满足企业用户的定制化需求,帮助企业提升研发效率。
通义灵码是国内用户规模第一的智能编码助手,基于 SOTA 水准的通义千问代码模型 CodeQwen1.5 研发,插件下载量已超 350 万,每日推荐代码超 3000 万次,被开发者采纳的代码超亿行,是国内最受欢迎的智能编程助手。目前,通义灵码编码助手也已「入职」了多家金融、汽车、新零售、互联网等企业。
通义灵码熟练掌握 Java、Python、Go、JavaScript、TypeScript、C/C++、C# 等 200 多种编程语言,可以辅助写代码、读代码、查 Bug、优化代码等。其底层模型是通义千问团队开发的 CodeQwen1.5,具备优秀的代码生成能力、长序列建模能力、代码修改能力和 SQL 能力,4 月份刚刚登顶 Big Code 模型排行榜。
为满足企业客户在私域知识检索、企业数据合规、统一管理等方面的需求,通义灵码推出标准版、专属版两个企业版。
标准版「开箱即用」,可以接入企业私域知识,实现私域知识问答,让 AI 推荐的代码更贴合企业规范;专属版在标准服务之外,提供公共云上专属实例部署、企业私有模型训练、独立企业账号系统等服务,满足大中型企业客户定制模型、节约算力的需求。
通义正在成为最受中国企业欢迎的大模型。根据最新数据,通义通过阿里云服务企业超过 9 万、通过钉钉服务企业超过 220 万,现已落地 PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。
今天,小米旗下的人工智能助手「小爱同学」也宣布和阿里云通义大模型达成合作,强化其在图片生成、图片理解等方面的多模态 AI 生成能力,并在小米汽车、手机等多类设备落地;微博、众安保险、完美世界游戏等企业也宣布接入通义大模型,将大模型应用于社交媒体、保险、游戏等领域。
此前,中国一汽、新东方、长安汽车等也宣布了与通义大模型的合作成果。
中国科学院国家天文台人工智能组也基于通义千问开发了新一代天文大模型「星语 3.0」,这是大模型首次应用于天文观测领域;陕煤建新煤矿等十余座矿山推出由通义支持的新型矿山重大风险识别处置系统,成为大模型在矿山场景的首次规模化落地。
阿里云一直以来强调要成为「AI 时代最开放的云」。如今,开源开放战略正为阿里云带来新的商业增长。




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
如何看待OpenAI最新发的ChatGPT-4o?文心一言、通义千问回答史上最强开源大模型 Llama 3正式发布。。。苹果罕见为广告道歉,撤回新 iPad 宣传视频/小米同意为开 39 公里故障车主换车/阿里发布通义千问 2.5卷疯了!最强开源大模型Llama 3发布,最大参数4000亿,小扎内心:大模型比元宇宙香多了周鸿祎向李彦宏“开炮”:有些名人胡说八道别被忽悠了;全球最强开源大模型Llama 3发布:最大模型参数将超4000亿丨AI周报最强开源大模型深夜炸场! Llama 3 王者归来,直逼 GPT-4, 马斯克点赞 | 附体验链接张核子回应张姗姗身份;雷军直播回应造车亏损;Meta发布最强开源大模型Llama 3;阿里拍卖回应前员工指控高管职场霸凌|邦早报Kimi、通义千问、Claude“变身”马斯克,它们这样评价雷军进城,去旧金山逛街雨里的故事微软开发者大会发布50多项更新;阿里披露对月之暗面的投资详情;通义千问主力模型降价97%|AIGC周观察第四十四期通义千问开源王炸,1100亿参数称霸开源榜单,中文能力全球第一全面赶超GPT-4 ?阿里云发布通义千问2.5最强开源大模型 Llama 3震撼发布!开源模型将追上GPT-4,4000亿参数模型也在路上开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型最强开源大模型Llama 3来了!4000亿参数狙击GPT-4,训练数据达Llama 2七倍小米汽车27分钟大定超50000台,雷军称发布会前一天降价3万/通义千问将接入多款Android手机/百度沈抖回应与苹果合作AI早知道|阿里云发布通义千问2.5;xAI 估值将约达180亿美元击穿全网底价,通义千问GPT-4级大模型直降97%!1块钱能买200万tokens阿里通义千问 GPT-4 级主力模型降价 97%,百度文心两大模型全面免费阿里通义千问GPT-4级主力模型降价97%,1 块钱200万 tokens!阿里通义千问2.5大模型发布;阿里达摩院提出“知识链”框架,逐步纠错降低大模型幻觉丨AIGC日报“寡姐”斯嘉丽称OpenAI未经同意刻意模仿其声音;阿里云宣布通义千问主力模型降价97%丨AIGC日报性能强,成本低,运行快!最强开源大模型出现,超越ChatGPT和Llama!阿里云突然发布全球最强开源模型 Qwen2,性能超越美国最强开源模型Chatgpt 读诗AI早知道|B 站开源轻量级 AI 语言模型;阿里通义Qwen2成最强开源大模型美股基本面 - 2024_03_10 * 晚报 * 拜登的竞选团队在国情咨文后筹集了1000万美元。华创宏观:目前市场预期美联望着天空的女孩扎克伯格最新2万字访谈:价值百亿美金的“最强开源大模型”Llama3及背后的一切华为相关人士辟谣P70预售,苹果或用百度人工智能,通义千问可处理千万字文档,微信回应朋友圈横线,这就是今天的其他大新闻!华为 Pura 70 系列上架即售罄/Meta 发布全球最强开源大模型/理想汽车 L6 发布开源超闭源!通义千问Qwen2发布即爆火,网友:GPT-4o危阿里云发布最强开源大模型Qwen2,干翻Llama 3,比闭源模型还强Meta、微软、Mistral AI、Hugging Face、通义、港中文六路进发开源大模型 | 大模型一周大事
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。