Redian新闻
>
免费、可商用,阿里云开源70亿参数通义千问大模型

免费、可商用,阿里云开源70亿参数通义千问大模型

公众号新闻

机器之心报道

机器之心编辑部

同等参数最强中英文模型 Qwen-7B 开源了!


 大模型的发展趋势,开始朝着开源道路前进了。

众所周知,ChatGPT、GPT-4 等这类明星大模型都是不开源的,与之相对应的,在开源领域,Meta 最近发布的 Llama 2 受到了大家的格外关注,因为这是一个免费且可商用的大模型系列。

今天,开源领域又迎来一个好消息,AI 模型社区魔搭 ModelScope 上架两款开源模型 Qwen-7B 和 Qwen-7B-Chat,阿里云确认其为通义千问 70 亿参数通用模型和对话模型。

最重要的是,两款模型都是开源、免费、可商用的。


  • 魔搭 ModelScope:
    https://modelscope.cn/models/qwen/Qwen-7B/summary
    https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary
  • Hugging Face 地址:https://huggingface.co/Qwen
  • GitHub地址:https://github.com/QwenLM/Qwen-7B

具体而言:

  • 通义千问 - 7B(Qwen-7B) 是阿里云研发的通义千问大模型系列的 70 亿参数规模的模型。Qwen-7B 是基于 Transformer 的大语言模型,在超大规模预训练数据上训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。它是支持中、英等多种语言的基座模型,在超过 2 万亿 token 数据集上训练,上下文窗口长度达到 8k;
  • Qwen-7B-Chat 是基于 Qwen-7B 基座模型的中英文对话模型,已实现与人类认知对齐。

此次开源的代码支持对 Qwen-7B 和 Qwen-7B-Chat 的量化,支持用户在消费级显卡上部署和运行模型。

想要下载模型的用户,既可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用 Qwen-7B 和 Qwen-7B-Chat,阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。

其实,早在今年 4 月,阿里云就推出了自家自研的大模型通义千问,此次开源的两款模型,大大降低了研究者使用大模型的门槛。这一举动也让阿里云成为国内首个加入大模型开源行列的大型科技企业。

在多个权威测评中,通义千问 7B 模型取得了远超国内外同等尺寸模型的效果,成为当下业界最强的中英文 7B 开源模型。

通义千问 7B 预训练模型在多个权威基准测评中表现出色,中英文能力远超国内外同等规模开源模型,部分能力甚至超过了 12B、13B 大小的开源模型。

在英文能力测评基准 MMLU 上,通义千问 7B 模型得分超过 7B、12B、13B 主流开源模型。该基准包含 57 个学科的英文题目,考验人文、社科、理工等领域的综合知识和问题解决能力。

在中文常识能力测评基准 C-Eval 上,通义千问在验证集和测试集中都是得分最高的 7B 开源模型,展现了扎实的中文能力。


在数学解题能力评测 GSM8K、代码能力评测 HumanEval 等基准上,通义千问 7B 模型也有不俗表现,胜过所有同等尺寸开源模型和部分大尺寸开源模型。

阿里云表示,开源大模型可以帮助用户简化模型训练和部署的过程,用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型。

随着通义千问的开源,相信会有更多的公司、机构加入到这一行列,为更多的研究者带来便利。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
阿里云通义千问140亿参数Qwen-14B发布;TCL中环签约首个绿电园区项目|绿研院日报阿里云通义千问全面开放|首席资讯日报Meta“搞大事”了:发布GPT“平替”Llama 2,开源、免费、还可商用!首个可商用的32k上下文开源大模型「长颈鹿」来了,两万词长文不在话下长篇小说《如絮》第一百二十五章 旧金山-2004年 如果时间能治愈爱奇艺VR公司业务停滞,员工或被欠薪;阿里云开源通义千问 70 亿参数模型,免费可商用;华为正式发布鸿蒙 4,接入大模型|Q资讯苹果已研究生成式AI多年/阿里云开源通义千问70亿参数模型/新一代Switch最早本月宣布国产130亿参数大模型免费商用!性能超Llama2-13B,支持8k上下文,哈工大已用上文学城大V“她死去了”传OpenAI对ChatGPT进行更新;百川智能正式推出70亿参数开源中英文大模型|AIGC周观察第六期大模型访问链接汇总:通义千问开放!通义千问能看图了!阿里云开源视觉语言大模型 Qwen-VL ,支持图文双模态输入阿里云通义千问开源;腾讯混元大模型开始应用内测;马斯克或从OpenAI买入域名Ai.com丨AIGC大事日报百川开源最强中英文百亿参数模型!超越LLaMA,中国开源大模型开启商用新纪元阿里云开源通义千问,曲阜师大室温超导实验未得出零电阻,特斯拉或年底完全自动驾驶,印度限制进口笔记本平板,这就是今天的其他大新闻!性能超越Llama2-13B,可免费商用,姚星创业公司开源百亿参数通用大模型未央播报 | 25日起存量首套房贷利率批量下调 阿里云宣布开源通义千问14B模型冷却的不止季节(73)— 疾言厉色国产语音对话大模型来了:李开复零一万物参与,中英双语多模态,开源可商用阿里云开源「通义千问」大模型;马斯克:特斯拉有望年底实现完全自动驾驶;妙鸭相机上线 B 端工作站 | 极客早知道通义千问能看图了!阿里云开源视觉语言大模型Qwen-VL ,支持图文双模态输入全球首个可商用生物医药大模型BioMedGPT-10B开源地中海邮轮行之八阿里云开源通义千问多模态视觉模型,号称“远超同等规模通用模型表现”大厂模型商用开源,阿里云起了个头650亿参数大模型预训练方案开源可商用!LLaMA训练加速38%,来自明星开源项目阿里大模型又开源!能读图会识物,基于通义千问7B打造,可商用百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报王小川大模型25天再升级!13B版本开源免费可商用,3090即可部署阿里云通义千问向全社会开放;OpenAI被作家起诉侵犯版权;工信部启动AGI等4大未来产业揭榜挂帅|AIGC周观察第十九期苹果公布第三财季业绩:营收818亿美元;马斯克:有望年底实现完全自动驾驶;阿里云宣布通义千问开源;星巴克中国回应被瑞幸反超...今天的音乐会 - 青春vs腐朽传滴滴造车VP创业大模型;澜舟科技推出400亿参数通用大模型;商汤AIGC相关收入增长670.4%32k上下文可商用!羊驼进化成长颈鹿,“开源大模型之最”中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。