Redian新闻
>
一个悄然崛起的国产开源大模型!

一个悄然崛起的国产开源大模型!

公众号新闻

大家好,我是 Jack~

自从 ChatGPT 发布以来,全球大模型技术蓬勃发展,各大厂商竞相推出了自家的 AI 大模型。

国内的开发者们或许没有想到,有朝一日,咱自家人开发的 AI 大模型,竟然让其他国家的网友感慨万千。

这个让日本和韩国网友感慨万千的「别人家的孩子」,就是阿里云的通义千问(英文名为 Qwen)。

而就在 5 月 9 日,阿里云正式发布了通义 2.5 大模型力升级、性能卓越,在 OpenCompass 开源基座大模型排行榜中,中文性能全面赶超 GPT-4 Turbo

免费使用地址:

https://tongyi.aliyun.com/qianwen

同时,阿里云也正式宣布了“通义千问App”更名为“通义App”,为所有用户提供免费服务。

在 2.5 版本中,模型相比上一版本在各个方面都有显著提升:

  • 理解力:提升9%;
  • 逻辑推理:提升16%;
  • 指令执行:提升19%;
  • 编程能力:提升10%。

可以说,在中文处理能力上,通义绝对是保持在行业的领先地位上。

而在 4 月 26 日,通义推出的拥有 1100 亿参数的开源模型 Qwen1.5-110B,更是在多个基准测试中超过了 Meta 的 Llama-3-70B 模型,直接把国外网友看傻了。

在 HuggingFace 的开源大模型排行榜 Open LLM Leaderboard 上,Qwen1.5-110B 荣登榜首。

HuggingFace开源大模型排行榜

模型发布不到 24 小时,ollama 便火速上线了对 110B 的支持。这意味着,你现在就可以通过 ollama 将 Qwen1.5-110B 部署到自己的电脑上运行。

阿里云 CTO 周靖人表示:

大模型这么多家,大家都说的是同样的故事,但最后比拼的就是能力差异。包括最后比拼的是怎么融合生态,尤其是开发者的生态。

怎么把它落地运用起来,才是最大的差异。

5 月 13 日,OpenAI 发布会上官宣的 GPT-4o 也印证了一点,OpenAI 也开始做落地应用,打造了拥有多模态实时交互能力的语音助理。

通义也在发力多模态上的应用,像聚焦音视频领域的通义听悟、聚焦长文档的通义智稳、聚焦代码领域的通义灵码等,提供了多场景、多模态的模型能力。

除了落地应用,通义也早早布局开源,去年 8 月,通义宣布加入开源行列,并迅速推出了多款开源模型。目前,通义开源模型的下载量已经超过 700 万。

除了常规的我们知道的不同参数量的基准大模型,通义还开源了视觉理解模型 Qwen-VL、音频理解模型 Qwen-Audio、代码模型 CodeQwen1.5-7B、混合专家模型 Qwen1.5-MoE 等。

这些模型也是广受好评:

自从大模型爆火以来,弱智吧就成了检测大模型能力的一项重要指标,我们来检测下通义的实战能力:

先输入一个脑筋急转:我今天有 3 个苹果,昨天吃了一个。现在有几个苹果?

这个问题如果不仔细想,很容给出错误答案 2,但通义不但给出了准确的答案,还分析了原因。

再问问弱智吧问题:

接下来考察下文本创作能力:

像读文档、写代码,这些常见的能力我们就不看了,我们玩玩视觉理解能力。

生活中遇到问题了,拍张照片上传,它也能给出一些意见。

大模型也给出了请及时就医的指导意见。

还能根据 emoji 表情猜成语:

我们加大难度,给它一个经典的验证码图:

说实话,这理解能力真的很强了!!

以上测试,只是通义众多功能中的冰山一角,感兴趣的读者可以前去官方网站一试。

通义 2.5 大模型进步还是挺大的!

好了,今天的内容就是这么多。

我是 Jack,我们下期见!

·················END·················

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
悄然崛起的英伟达新对手零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新回国过春节, 逛庙会发了心脏病卷疯了!最强开源大模型Llama 3发布,最大参数4000亿,小扎内心:大模型比元宇宙香多了英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4oDatabricks开源大模型DBRX,以及这对Databricks公司的商业,估值,上市等方面的影响。。。开放开源!蚂蚁集团浙江大学联合发布开源大模型知识抽取框架OneKE真假开源:开源大模型的实际开放性探讨最强开源大模型 Llama 3震撼发布!开源模型将追上GPT-4,4000亿参数模型也在路上许家印组织造假被罚4700万;马斯克开源大模型Grok-1;侯毅正式卸任盒马CEO;英伟达推出最强AI芯片...周鸿祎向李彦宏“开炮”:有些名人胡说八道别被忽悠了;全球最强开源大模型Llama 3发布:最大模型参数将超4000亿丨AI周报14开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型Meta、微软、Mistral AI、Hugging Face、通义、港中文六路进发开源大模型 | 大模型一周大事《我们新疆好地方》- 新疆行马斯克加入了开源大模型阵营简单快乐的气场,被多数人喜爱阿里云发布最强开源大模型Qwen2,干翻Llama 3,比闭源模型还强苹果一次性开源了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面开源AI早知道|B 站开源轻量级 AI 语言模型;阿里通义Qwen2成最强开源大模型国产开源Sora上新:全面支持国产AI算力,可用ReVideo视频编辑,北大-兔展团队出品开源大模型王座再易主,1320亿参数DBRX上线,基础、微调模型都有李彦宏:开源大模型不如闭源,后者会持续领先;周鸿祎:“开源不如闭源” 的言论是胡说八道见证美国未来二十年人口大变局微软秒删堪比GPT-4的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试曾被嘲笑,如今全网爆红,国货为何突然崛起?今日arXiv最热CV大模型论文:国产开源视觉大模型InternVL 1.5发布,赶超GPT-4V水准微软秒删堪比 GPT-4 的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试全球开源新王Qwen2-72B诞生,碾压Llama3-70B击败国产闭源模型!AI圈大佬转疯了开源大模型火了!(附99个大模型微调模型/数据/工具)!开源日报 | 离职后可以删除自己所写的软件吗;国产开源笔记本电脑在深圳发布;全球首位AI程序员爆火1至2月社零总额增长5.5%,马斯克突然开源大模型 | 财经日日评字节开源大模型量化新思路,2-bit量化模型精度齐平fp16马斯克正式开源 Grok-1,成为全球最大的开源大模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。