让CPU跑大模型该怎么做?阿里云交出答卷:AI推理速度飙升7倍
AI应用落地加速,对推理的性能提出了更加苛刻的要求。
就在上周,阿里云重磅升级了第八代企业级通用计算实例ECS g8i,国内首款搭载英特尔第五代至强可扩展处理器Emerald Rapids的实例。相比上一代,g8i整机性能最高提升85%,AI推理性能最高提升7倍,可支撑720亿参数规模的大语言模型,帮助中小规模模型起建成本降低50%。
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章