老黄解释为啥没有全上reduced precision chip# Stock
c*a
1 楼
就是这个视频的开头两三分钟。用XAVIER有两个DLA,原来的他家的DLA。就是reduced
precision DLA,对已知的network做优化用DLA做,比CUDA 更energy efficient 33%,
但其他的网络用GPU在CUDA上做。
两个想法,
老黄对reduced precision accelerator是很上心的,对神经网络结构是了解的,也可
以制造DLA,他不太可能被take by surprise,也不太可能让初创靠降低精度做大了。
现在没有出专门的DL芯片是考虑到多样性。有必要的话肯定是可以出的。
但他说DLA比cuda节能33%,好像我听到一些初创号称的节能性比这个强多了?
precision DLA,对已知的network做优化用DLA做,比CUDA 更energy efficient 33%,
但其他的网络用GPU在CUDA上做。
两个想法,
老黄对reduced precision accelerator是很上心的,对神经网络结构是了解的,也可
以制造DLA,他不太可能被take by surprise,也不太可能让初创靠降低精度做大了。
现在没有出专门的DL芯片是考虑到多样性。有必要的话肯定是可以出的。
但他说DLA比cuda节能33%,好像我听到一些初创号称的节能性比这个强多了?