国内首个开源千亿参数MoE大模型来了！性能超Grok-1，单张GPU可跑

科技

2024-04-02 11:04

APUS-xDAN-4.0（MoE）参数规模1360亿，可在消费级显卡4090上运行。

作者 | 程茜

编辑 | 心缘

智东西4月2日报道，今天，全球移动互联网公司APUS与大模型创企新旦智能宣布，联手开源国内首个千亿参数的MoE（混合专家模型）APUS-xDAN大模型4.0，这也是国内首个可以在消费级显卡上运行的千亿MoE中英文大模型。

APUS-xDAN-4.0（MoE）参数规模为1360亿，可在消费级显卡4090上运行，据APUS实测，其综合性能超过GPT-3.5，达到GPT-4的90%。

数学能力上，测评基准GSM8K的测评得分为79，理解能力MMLU达到73分。

项目地址：

https://github.com/shootime2021/APUS-xDAN-4.0-moe?tab=readme-ov-file

推荐智东西年度会议。4月18-19日，2024中国生成式AI大会将在北京举行。免费报名或购票通道开放中，期待你的参会~

01.

数学、推理能力碾压

推理成本下降400%

APUS-xDAN-4.0（MoE）在GitHub的页面显示了基准测评结果，其与Mixtral-8x7B（MoE）、Llama2-70B、Grok-1（MoE）进行了对比。

其中衡量模型语言理解、知识和推理能力的基准测试MMLU中，APUS-xDAN-4.0（MoE）排名第一，超过了Grok-1（MoE）。

在测试多步骤数学推理能力的单词问题集合测试GSM-9K以及MATH中，该模型得分均远高于其他三大模型。

四项测试中，APUS-xDAN-4.0（MoE）在多学科任务的BIG-Bench-Hard测试中，得分为66.4，接近Mixtral-8x7B（MoE），低于Grok-1（MoE）的71.7分。

其中，Mixtral-8x7B（MoE）由大模型创企Mistral AI于去年年底发布，并在多项基准测试中性能都基本达到GPT-3.5；Llama2-70B是去年7月Meta开源的Llama 2大模型系列中，参数规模最大的版本；Grok-1（MoE）为马斯克旗下AI创企xAI本月初开源的大模型，参数规模为3140亿参数，是目前开源大模型中参数规模之最。

此外，在GitHub页面显示，APUS-xDAN-4.0（MOE）开源模型在“IQ-Quantized Tech”上量化为1.5位、2位和4位，可以在消费级显卡4090上运行。

具体来说，APUS-xDAN 大模型4.0（MoE）采用GPT-4类似的MoE架构，特点是多专家模型组合，同时激活使用只有2个子模块，实际运行效率对比传统Dense同尺寸模型效率提升200%，推理成本下降400%。在实际部署中，研究人员通过进一步高精度微调量化技术，使得模型尺寸缩小500%。

02.

32个MoE Transformer块组成

可处理多线程复杂需求

在实际的效果中，APUS-xDAN-4.0（MoE）可以理解复杂需求，如撰写广告文案时，要求涵盖“火焰人”、固定口号、摇滚乐歌词等。