Redian新闻
>
用普通工作站搭一个卷积神经网能干点什么?
avatar
用普通工作站搭一个卷积神经网能干点什么?# ComputerGraphics - 电脑图形处理
i*D
1
比如普通的xeon cpu的机器。用来从800x600的图片中把特定物体边界识别出来。可以
用caffe搭个cnn出来吧。那么在这种应用下,是不是一种选择就是cpu+ram来算,即便
是双xeon的cpu+32gb的ram算起来也不如一个1050的显卡和4g显存算起来快吧?用gpu来
算再用ram的话产生的overhead就非常非常大了吧?那么在这种情况下主要的瓶颈是内
存还是是cpu?我感觉内存决定了多少层和多深?cpu或者gpu决定了运行起来多快,尤
其是训练时候?二者都是随节点数的平方增长的?我是外行哈,就是有点想买个电脑来
以后干点这些工作,有谁做过类似的给点装机指导哈~~提前谢过
avatar
A*l
2
上tensorflow吧,比caffe好用多了。

【在 i*******D 的大作中提到】
: 比如普通的xeon cpu的机器。用来从800x600的图片中把特定物体边界识别出来。可以
: 用caffe搭个cnn出来吧。那么在这种应用下,是不是一种选择就是cpu+ram来算,即便
: 是双xeon的cpu+32gb的ram算起来也不如一个1050的显卡和4g显存算起来快吧?用gpu来
: 算再用ram的话产生的overhead就非常非常大了吧?那么在这种情况下主要的瓶颈是内
: 存还是是cpu?我感觉内存决定了多少层和多深?cpu或者gpu决定了运行起来多快,尤
: 其是训练时候?二者都是随节点数的平方增长的?我是外行哈,就是有点想买个电脑来
: 以后干点这些工作,有谁做过类似的给点装机指导哈~~提前谢过

avatar
i*D
3
比如普通的xeon cpu的机器。用来从800x600的图片中把特定物体边界识别出来。可以
用caffe搭个cnn出来吧。那么在这种应用下,是不是一种选择就是cpu+ram来算,即便
是双xeon的cpu+32gb的ram算起来也不如一个1050的显卡和4g显存算起来快吧?用gpu来
算再用ram的话产生的overhead就非常非常大了吧?那么在这种情况下主要的瓶颈是内
存还是是cpu?我感觉内存决定了多少层和多深?cpu或者gpu决定了运行起来多快,尤
其是训练时候?二者都是随节点数的平方增长的?我是外行哈,就是有点想买个电脑来
以后干点这些工作,有谁做过类似的给点装机指导哈~~提前谢过
avatar
A*l
4
上tensorflow吧,比caffe好用多了。

【在 i*******D 的大作中提到】
: 比如普通的xeon cpu的机器。用来从800x600的图片中把特定物体边界识别出来。可以
: 用caffe搭个cnn出来吧。那么在这种应用下,是不是一种选择就是cpu+ram来算,即便
: 是双xeon的cpu+32gb的ram算起来也不如一个1050的显卡和4g显存算起来快吧?用gpu来
: 算再用ram的话产生的overhead就非常非常大了吧?那么在这种情况下主要的瓶颈是内
: 存还是是cpu?我感觉内存决定了多少层和多深?cpu或者gpu决定了运行起来多快,尤
: 其是训练时候?二者都是随节点数的平方增长的?我是外行哈,就是有点想买个电脑来
: 以后干点这些工作,有谁做过类似的给点装机指导哈~~提前谢过

avatar
T*0
5
主要瓶颈是显存。GPU在cnn的速度优势不是cpu可比的。在计算的时候,数据会存储在
gpu的显存中。当model过大无法完全存储在显存中的时候,显卡就需要把部分model存
储在内存中,然后需要不断的从内存中掉入、存储model。这时候,cpu和ram的I/O速度
远跟不上gpu的速度,gpu就需要闲置等待I/O结束后再继续计算。
做cv方向的deep learning,cpu/ram不是很重要,好显卡+大显存的用处会大得多得多。
另外,像楼上说的,你可以考虑tensorflow。比caffe强大、灵活。
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。