Redian新闻
>
大厂模型商用开源,阿里云起了个头

大厂模型商用开源,阿里云起了个头

公众号新闻
作者薛良Neil
邮箱[email protected]

看来开源的力量势不可挡。

8月3日,通义千问70亿参数通用模型和对话模型(简称Qwen-7B和Qwen-7B-Chat)出现在AI模型社区魔搭ModelScope上,两款模型均开源、免费、可商用。

由此,阿里云成为国内大厂中第一个开源大模型的企业。

Qwen-7B是支持中、英等多种语言的基座模型,Qwen-7B-Chat是基于基座模型的中英文对话模型,在许多测基准,比如MMLU、C-Eval 中,Qwen-7B在70亿参数规模领域上都取得了良好的表现,阿里云表示其部分能力甚至可以赶超一些120亿参数大模型。

用户目前已经可以从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用这些模型,而通过开源代码,用户可以很方便地在消费级显卡上部署和运行模型。阿里云基于大模型的服务,包括训练、推理、部署和精调都可以应用在上述两个模型上。

这不是国内第一个免费、可商用的大模型。就在半个月前,智谱 AI 宣布 ChatGLM-6B 和 ChatGLM2-6B 允许免费商业使用,百川智能的Baichuan 13B模型在发布的同时就开源允许免费商用。

但通义千问是成为了第一个科技大厂的开源大模型,它的开源将被视为国内“百模大战”进入新阶段的一个标志——现在无论中美,也无论巨头还是中小初创公司,有关大模型开源的看法正在趋近于一致。

在Meta宣布开源LLaMA 2 的时候,Meta 首席科学家、图灵奖获得者 Yann LeCun就宣称,大模型行业的竞争格局将会改变。这是因为闭源依靠大力出奇迹的方式证明了大模型路线的可性能和极限,而开源则会通过繁荣的生态,让大模型变得真正可用、易用。

换而言之,大模型本身的神秘光环正在逐渐消褪。当技术不再难以逾越,繁荣的开源生态以及由此带来的群策群力的技术迭代和突破就成为了新的护城河。在7月举办的世界人工智能大会上,阿里云将促进中国大模型生态的繁荣作为自己的首要目标。

为此,阿里云打出了一套组合拳。

比如阿里云的灵积模型服务平台,它提供了一系列自动化的模型上云工具链路,让模型不仅能通过推理API被集成,也能通过训练微调API实现模型定制化。另外,去年推出的AI模型社区魔搭,已经聚集了20多家顶尖人工智能机构贡献的1000多款开源模型。它们彼此的部署链路是打通的,也就是说来自社区的模型可以通过灵积实现服务化——这看上去就像是个起步阶段的模型自由市场,它能够实现,当然是开源的功劳。

而任何市场都需要充分的竞争,归根结底,阿里云想要通过降低门槛来让开源大模型生态繁荣起来,就需要提供足够丰富、足够高质量的开源大模型参与其中。

通义千问的开源势在必行。

由此,千帆竞渡的百模大战,现在已经进入到了真刀真枪贴身肉搏环节——模型究竟好不好,不是靠吹出来的,开源到社区里,群众自会检验。

欢迎来到自由的大模型开放世界。



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
四十二 传说百模大战之下,阿里云最在意的还是生态通义千问能看图了!阿里云开源视觉语言大模型 Qwen-VL ,支持图文双模态输入阿里100瓶毒药解马斯克难题?国内首个大模型价值对齐数据集开源,15万评测题上线!武汉AI方案出台六大计划;360讯飞WPS大模型面向全民开放;阿里云发布开源LLM开发框架爱奇艺VR公司业务停滞,员工或被欠薪;阿里云开源通义千问 70 亿参数模型,免费可商用;华为正式发布鸿蒙 4,接入大模型|Q资讯5085 血壮山河之武汉会战 黄广战役 17百川开源最强中英文百亿参数模型!超越LLaMA,中国开源大模型开启商用新纪元阿里云通义千问开源;腾讯混元大模型开始应用内测;马斯克或从OpenAI买入域名Ai.com丨AIGC大事日报阿里大模型又开源!能读图会识物,基于通义千问7B打造,可商用Meta发布大规模视觉模型评估基准FACET!开源视觉模型DINOv2允许商用阿里云 CTO 周靖人:AI 时代,为什么阿里云一定要做开源四十一 惊雷环游世界的北非蛋免费、可商用,阿里云开源70亿参数通义千问大模型阿里云开源通义千问多模态视觉模型,号称“远超同等规模通用模型表现”苹果已研究生成式AI多年/阿里云开源通义千问70亿参数模型/新一代Switch最早本月宣布更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了 |【经纬低调分享】对话共生矩阵张林:大模型商业化要「两条腿」走路,开源落地优势不大彻底开源,免费商用,上海AI实验室把大模型门槛打下来Meta 计划大模型开源,允许商用;极兔提交 IPO 申请,去年营收 73 亿美元;6 月初全球气温破纪录 | 极客早知道15小时、几千元训完中文版LLaMA2!低成本方案全面开源,包含代码权重,支持商用未央播报 | 25日起存量首套房贷利率批量下调 阿里云宣布开源通义千问14B模型一夜之间,大模型格局巨变!已开源,可直接商用!上海强攻算力高地,打响大模型商用基建第一枪大模型商用新解法:CVP架构崛起,向量数据库破圈阿里云开源「通义千问」大模型;马斯克:特斯拉有望年底实现完全自动驾驶;妙鸭相机上线 B 端工作站 | 极客早知道麦内尼乌斯:促成平民保民官设立的协调人通义千问能看图了!阿里云开源视觉语言大模型Qwen-VL ,支持图文双模态输入百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报微软也搞起了开源小模型!利用OpenAI的ChatGPT和GPT-4 训练,实力碾压当前最强开源模型行业观察 | 开源,阿里云想激发中国大模型生态650亿参数大模型预训练方案开源可商用!LLaMA训练加速38%,来自明星开源项目更强的Llama 2开源,可直接商用:一夜之间,大模型格局变了阿里将继续对阿里云进行分拆上市,传阿里云考虑从国有公司融资至多28亿美元
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。