国产720亿参数开源免费模型来了！对标Llama2 70B，一手实测在此

科技

2023-12-01 10:12

鱼羊发自凹非寺
量子位 | 公众号 QbitAI

最强开源大模型，再次易主！

就在刚刚，阿里云通义千问又双叒开源了，并且直接开大：甩出了720亿参数版本——

在中国的开源大模型中，少见地直接对标最大号羊驼Llama2-70B。

此番登场，这个代号为Qwen-72B的模型在10个权威基准评测中刷新开源模型最优成绩。

在部分测评，如中文任务C-Eval、CMMLU、Gaokao中，得分还超过了闭源的GPT-3.5和GPT-4。

但这，还不是阿里云这波开源的全部内容。

适用于边端设备的18亿参数版本Qwen-1.8B和音频大模型Qwen-Audio也被同时释出。

加上此前开源的Qwen-7B、Qwen-14B和视觉大模型Qwen-VL，阿里云通义全家桶主打一个“全尺寸”、“全模态”，可以说是非常全面了。

如此开源大手笔，不仅在国内，在国外也受到了广泛关注。

其中最受热议的Qwen-72B，我们也第一时间测试了一波。

720亿参数通义千问上手实测

Qwen-72B基于3T tokens的高质量数据训练，从此次公布的测评数据来看，性能相较于此前的开源版本全面升级：

英语任务上，Qwen-72B在MMLU基准测试中取得了开源模型最高分，超过了Llama2全系列。

中文任务上，Qwen-72B刷榜C-Eval、CMMLU、Gaokao等测试基准，得分超过GPT-4。

数学推理方面，Qwen-72B在GSM8K、MATH测评中获得了明显优于其他开源模型的高分。

代码能力方面，Qwen-72B在HumanEval、MBPP上亦有提升。

既然如此，我们就从复杂语义理解、数学以及逻辑推理这几个大模型的关键能力着手，来浅测一下720亿参数通义千问究竟能打不能打。

中文复杂语义理解

首先，来点一词多义，看看Qwen-72B是否能够清楚地判断出“一把把把把住”这句话里的弯弯绕绕。

这句话的意思并没有难住Qwen-72B，它甚至还分析出了句子里人物的情绪。但在具体分析每一个“把”字是什么意思时，似乎没有判断出“一把”是一个完整的词。

同样的问题抛给GPT-4，也是整体意思get到了，但细节分析上仍有瑕疵。

我们再测试一道选择题，列出几个看上去很像的词组，看看Qwen-72B能不能找出不同。

回答正确，72B选手顺利分析出了只有B选项中两个词组的意思是相反的。

看来复杂语义理解方面，Qwen-72B确实有两把刷子。

那么接下来，我们就进入经常让大模型们“翻车”的数学测试环节。

数学能力

话不多说，直接上道高考题，看看72B选手排列组合学得怎么样。

Bingo！思路没毛病，答案也正确。

如果在题目中设置一些小陷阱，比如单位换算呢？

依然没难住Qwen-72B。它还提醒我们这个问题出得并不严谨：你也没告诉我这池里有水没水、水满没满啊。

逻辑推理

数学语文都还挺好，那么Qwen-72B这个开源大模型，逻辑推理能力又如何？

我们继续测试。

第一道题是：

标清：高清：超清
A、亚音速：音速：超音速 B、厅级：市级：省级 C、迁怒：愤怒：暴怒 D、幽静：寂静：安静

Qwen-72B发现了这是一个类比推理题，只有A选项中，三个词之间的关系和“标清：高清：超清”是一致的。

再加大一点难度，让72B选手替我们找出“天堂之门”呢？

策略也没有问题：选择相反的那扇门就对了。

正常题目没难住，我们决定给72B选手一点脑筋急转弯的小震撼……

小明的妈妈有三个孩子，老大叫一明，老二叫二明，老三叫什么？

Qwen-72B这波可以说是稳稳拿捏了。

简单总结一下，在复杂语义理解、数学和逻辑推理能力方面，Qwen-72B确实有不错的表现。

有意思的一点是，研发团队提到，为了让Qwen-72B能被下游应用更简单地集成，他们还对Qwen-72B的指令遵循、工具使用等技能作了技术优化。

比如，搭载系统指令（System Prompt）能力，只需一句话，你就能让Qwen-72B扮演特定角色，成为你的定制化AI助手。

就像介样……

量：你是《原神》里的钟离，请模仿钟离的语气和我说话。
量：我怎么做才能一夜暴富？
钟离版千问：一夜暴富，是许多凡人心中的幻想。然而，生者的命运往往由无数偶然与必然交织而成，非一蹴而就之事。我虽拥有千年岁月的经验，但要论及一夜暴富，却是无从谈起。
在璃月港的民间传说中，或许有某些机缘巧合之下一夜致富的故事，但这多为人们茶余饭后的谈资，不可尽信。真正的财富，无论是物质上的还是精神上的，都需要通过不懈的努力和时间的积累才能获得。
若真希望增加收入，改善生活，倒是可以尝试努力工作、提高技艺，或寻找合法且适合自己能力的投资机会。此外，秉持诚实守信的原则，广结善缘，也是累积财富不可或缺的因素。不过，对于那些寻求捷径、投机取巧之人，终将付出相应的代价。
请记住，求财之心人皆有之，但切勿因此迷失自我，忘记了生命中真正重要的东西。