性能对标Llama 3,算力消耗仅1/19!源2.0-M32大幅提升模算效率
智东西5月28日报道,今天,浪潮信息发布基于MoE的源2.0-M32开源大模型,全面开源且支持免费可商用,全系列模型参数和代码均可免费下载使用。
源2.0-M32采用基于注意力机制的门控网络技术,包含32个专家模块,参数量为400亿,模型运行时激活参数为37亿。同时,该模型在模型性能全面对标700亿参数规模Llama 3的同时,训练、微调、推理过程中的算力开销显著低于业界的头部开源模型Llama3-70B,源2.0-M32单Token下训练和推理所需的算力资源仅为Llama3-70B的1/19。
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章