深度学习GPU选购指南:哪款显卡配得上我的炼丹炉?
新智元报道
新智元报道
【新智元导读】最近,曾拿到斯坦福、UCL、CMU、NYU博士offer、目前在华盛顿大学读博的知名测评博主Tim Dettmers在自己的网站又上线了深度学习领域的GPU深度测评,到底谁才是性能和性价比之王?
稀疏的网络训练
低精度计算
风扇设计和GPU温度
优雅地解决功耗限制问题
RTX 4090接头起火问题
H100和RTX40中的8位浮点支持
有了8位输入,它允许你以两倍的速度加载矩阵乘法的数据,你可以在缓存中存储两倍的矩阵元素,而在Ada和Hopper架构中,缓存是非常大的,现在有了FP8张量核心,你可以为RTX 4090获得0.66 PFLOPS的计算量。
首先确定你需要多大的GPU内存(至少12GB用于图像生成,至少24GB用于处理变压器);
针对选8位还是16位(8-bit or 16-bit),建议是能上16位就上,8位在处理复杂编码任务时还是会有困难; 根据上图中的指标,找到具有最高相对性能/成本的GPU。
综合推荐
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章