avatar
求个建议装机计算用# Hardware - 计算机硬件
r*5
1
呵呵。。。周末和今天做的菜,挑了能见人的三个。
【牛尾汤】
山寨爱厨姐姐的,我忘了给西红柿剥皮,然后浮油也捞得不够,所以图片看着油腻腻的。
材料:
牛尾一副(約重800g),馬鈴薯3個(約450g),胡蘿蔔200g(2根),蕃茄2個。
薑2片,料酒1大匙,水半鍋。蔥2支,薑3片,料酒1大匙,水10杯,鹽2小匙。
做法:
1. 牛尾洗淨(如果是整根未剁的,要先剁成幾節再用),燒熱半鍋水,放入薑2片、料
酒1大匙,水滾之後熄火,放入牛尾翻轉燙熟,約10分鐘,撈出洗淨血水。
2. 另起湯鍋,放入10杯水與蔥薑,加熱至水滾開,放入牛尾,加料酒,水再次滾開時
轉成小火,加蓋燉約一個半小時。(我會在這時撈除表面浮油,以免太油膩)
3. 把湯裡的蔥薑撈除。馬鈴薯去皮、切塊,胡蘿蔔切滾刀塊,蕃茄切塊,全部放入湯
裡,大火燒開之後,再轉小火續煮30~40分鐘,加鹽調味即可。
avatar
k*u
2
请问开过chase checking acct拿过bonus后,是不是再开saving acct就不送钱啦?
多谢
avatar
q*k
3
在这里问一下RELINK的问题。相信大家都是NIW和EB1同时递交的,如果两个140都批了
,是不是交了EB1的485就一定要RELINK NIW的485?怎样做才可以呢。 6月底的FP,
到现在还没有什么消息呢。感谢了。
avatar
b*n
4
打算在感恩节前后装个新机器计算用.主要用GPU计算,显卡用GTX 7系列或者6系列.CPU
要求不高,主要是日常处理,最多做一些测试,matlab之类的.
求建议用什么CPU? 希望物美价廉性价比高一些,4核最好.现在我考虑用AMD的FX系列,4
核100一下能解决问题.不想用intel主要是因为价钱高,而且整合gpu我也不需要.
avatar
r*5
5
【沙茶鸡翼】
山寨毛毛妈的,那个汁被我不小心给倒掉了,然后直接捞出鸡翅拌的沙茶酱,结果就变
得比较干,汗~
第一张自然光底下好像还不错,后面两张是在昏暗的灯光下拍的。
好玩,切了几朵胡萝卜花,抽了3根葱丝,装饰一下,嘿嘿。。。
用料:
1:鸡翅中段和上段翅700克,洗净沥水。
2:绍酒1大匙,水1杯,生抽酱油1大匙,老抽2大匙,糖1大匙。
3:橄榄油2大匙,葱1根洗净切段,姜片3片,八角1粒,丁香1粒。
4:牛头牌沙茶酱1大匙。
做法:
不沾锅,置炉上开大火,加2大匙橄榄油,放入葱段,姜片,八角和丁香炒香,然后下
鸡翅炒至焦香。喷入1大匙绍酒,然后依次放入剩余的2料煮滚,调中小火,加盖焖煮35
分钟。调大中火稍微收汁,放入沙茶酱兜匀即可。
avatar
k*7
6
两码事
avatar
S*n
7
用GPU计算,应该选AMD的卡吧。
GTX 7系列或者6系列 都是游戏卡,计算能力不行的,特别是双精度计算都不行。
民用计算还是AMD的7990和7970强。

CPU
4

【在 b*********n 的大作中提到】
: 打算在感恩节前后装个新机器计算用.主要用GPU计算,显卡用GTX 7系列或者6系列.CPU
: 要求不高,主要是日常处理,最多做一些测试,matlab之类的.
: 求建议用什么CPU? 希望物美价廉性价比高一些,4核最好.现在我考虑用AMD的FX系列,4
: 核100一下能解决问题.不想用intel主要是因为价钱高,而且整合gpu我也不需要.

avatar
r*5
8
【空心菜两吃】
哇,终于到我的“原创”了----肯定是0技术啦~
呵呵。。。我想大家都这么做过:叶子,菜梗分开吃啊。
1,叶子用蒜末炒就好了,因为炒过头了,青绿变墨绿了,那我不上照片了,省得毁我
名声。
2,菜梗切段,热油爆一下蒜末,然后加菜梗翻炒,加点点盐,半熟的时候,加入辣豇
豆继续炒到菜梗软一点了就可以啦。
avatar
g*y
9
why not?
avatar
S*n
10
说得好像AMD不整合GPU一样。
AMD CPU内集成的GPU比intel更强。

CPU
4

【在 b*********n 的大作中提到】
: 打算在感恩节前后装个新机器计算用.主要用GPU计算,显卡用GTX 7系列或者6系列.CPU
: 要求不高,主要是日常处理,最多做一些测试,matlab之类的.
: 求建议用什么CPU? 希望物美价廉性价比高一些,4核最好.现在我考虑用AMD的FX系列,4
: 核100一下能解决问题.不想用intel主要是因为价钱高,而且整合gpu我也不需要.

avatar
b*t
11
都好漂亮呀!
汤去油的话其实还是隔天的比较好弄,冰箱里一冻把上面结住的油去掉就好了;以前还
看到有介绍的方法是撕半张paper towel用毛边去吸,感觉不比直接用勺子好多少。
心心拍完照片是直接传的吗
avatar
a*1
12
FX没有的

【在 S******n 的大作中提到】
: 说得好像AMD不整合GPU一样。
: AMD CPU内集成的GPU比intel更强。
:
: CPU
: 4

avatar
f*e
13
最后一道看得很开胃!
avatar
a*1
14
GTX TITAN 还是目前的GPGPU民用之王,那个Double Precision Throuput (1/3) 基本
上是专业卡的水平
http://stackoverflow.com/questions/16027391/nvidia-gpus-for-res

【在 S******n 的大作中提到】
: 用GPU计算,应该选AMD的卡吧。
: GTX 7系列或者6系列 都是游戏卡,计算能力不行的,特别是双精度计算都不行。
: 民用计算还是AMD的7990和7970强。
:
: CPU
: 4

avatar
s*m
15
炒空心菜杆,我家夏天常吃的,配稀饭~~~
avatar
E*e
16
如果只用单精度
gtx靠谱嘛?

【在 S******n 的大作中提到】
: 用GPU计算,应该选AMD的卡吧。
: GTX 7系列或者6系列 都是游戏卡,计算能力不行的,特别是双精度计算都不行。
: 民用计算还是AMD的7990和7970强。
:
: CPU
: 4

avatar
r*5
17
呵呵。。。谢谢獭獭~~
嗯,是滴,等第二天上面结了一层油脂比较方便。当时等不及想拍照了,而且土豆被我
炖久了一碰就碎,我想要的清汤啊差不多都给毁了,如果等第二天在动一动,我怕更不
好看了,呵呵。。。
我拍了照,切了边边角角,把size弄小,加个边框就传啦~~
想把照片美化一下,可惜不会,呵呵。。。

【在 b*******t 的大作中提到】
: 都好漂亮呀!
: 汤去油的话其实还是隔天的比较好弄,冰箱里一冻把上面结住的油去掉就好了;以前还
: 看到有介绍的方法是撕半张paper towel用毛边去吸,感觉不比直接用勺子好多少。
: 心心拍完照片是直接传的吗

avatar
i*t
18
我也想配个做计算的电脑 同求!
avatar
r*5
19
呵呵,谢谢,的确最后一道菜吃得最多~~

【在 f*******e 的大作中提到】
: 最后一道看得很开胃!
avatar
o*n
20
buy.com 的hp420 最近减价,771.99, e5-1650,光这个cpu就600刀左右了
avatar
r*5
21
呵呵。。。握手!嗯,这个菜是很下饭呢~~

【在 s****m 的大作中提到】
: 炒空心菜杆,我家夏天常吃的,配稀饭~~~
avatar
b*n
22
cpu拼不过gpu.
计算肯定是gpu了,上千个cuda核。现在需要一块性价比好的cpu,4核最好,处理日常
工作。

【在 o**n 的大作中提到】
: buy.com 的hp420 最近减价,771.99, e5-1650,光这个cpu就600刀左右了
avatar
p*t
23
我一般叶子和杆子一起炒。

【在 r**********5 的大作中提到】
: 呵呵。。。握手!嗯,这个菜是很下饭呢~~
avatar
f*r
24
用e3 1230

【在 b*********n 的大作中提到】
: cpu拼不过gpu.
: 计算肯定是gpu了,上千个cuda核。现在需要一块性价比好的cpu,4核最好,处理日常
: 工作。

avatar
b*e
25
沙茶鸡翼很吸引,家里还有沙茶酱,改天试试看 =)
avatar
b*n
27
擦,server cpu可不便宜啊!而且这玩意儿能用non ecc内存吗?

【在 f*******r 的大作中提到】
: 用e3 1230
avatar
S*n
28
双精度计算能力:
GTX titan: 1.30 TFLOPs 价格$999
GTX 780: 0.19 TFLOPs 价格$499
AMD 7970: 1.04 TFLOPs 价格$299
AMD 7990: 2.04 TFLOPs 价格$799
自己看性价比吧,7990其实是两块7970.
性能对比:
http://www.tomshardware.com/reviews/radeon-hd-7990-review-bench
要论民用之王,还是AMD 7990吧。难道 2.04 < 1.30 ?
外加上楼主也没有提Titan,Titan是很强,但是比7990还是差一点点,价格贵一点点。
如果是我,买两块 AMD 7970 交火,用600多刀的价格达到约 2 TFLOPs的双精度浮点,
约8 TFLOPs的单精度浮点。

【在 a******1 的大作中提到】
: GTX TITAN 还是目前的GPGPU民用之王,那个Double Precision Throuput (1/3) 基本
: 上是专业卡的水平
: http://stackoverflow.com/questions/16027391/nvidia-gpus-for-res

avatar
S*n
29
那还是打游戏吧。游戏渲染就只用单精度。

【在 E***e 的大作中提到】
: 如果只用单精度
: gtx靠谱嘛?

avatar
r*i
30
E3就是i7的价,实质也差不多,应该可以用non ECC

【在 b*********n 的大作中提到】
: 擦,server cpu可不便宜啊!而且这玩意儿能用non ecc内存吗?
avatar
x*o
31
GTX的比AMD的好,主要是cuda提供了很多方便,像BLAS一类的用现成的就行了。AMD系
列的没有cuda这样的。
avatar
S*n
32
有钱就买Telsa 或 Titan。
没钱就只能AMD OpenCL了,这两年OpenCL应用也不少了。从两年前的几款应用到现在的
好几千款应用了~~~
现在intel,apple都提供了对OpenCL的支持吧,特别是apple,不遗余力的。
apple的Mac pro大圆桶就是异构计算的典型配置,可以参考一下。
http://store.apple.com/us/buy-mac/mac-pro
OpenCL是提供了API接口,可以在C++里调用这些SDK。
不过CUDA更底层一些,软件和驱动成熟一些,毕竟软件上耕耘的时间更长,编程灵活一
些。
用CUDA搞计算,PGI Visual Fortran 少不了,google一下盗版就有下载的。
自己决定买什么吧,其实条条大路通罗马。
真的通用计算,还是intel的系统软件上更容易一些。
美国正在造的超算,将是纯intel 12核CPU + intel SSD; (编程容易,纯粹的x86-
64编程环境。)
中国的天河二号,intel 12核CPU + intel phi计算加速卡; (编程也容易,phi计算
卡也是x86系统。)
天河一号A,intel 8核CPU + NV Tesla计算加速卡; (需要CUDA编程了)
天河一号,intel 4核CPU + AMD显卡加速计算;(需要调用OpenCL接口编程)
从“天河一号”到“天河一号A”到“天河二号”,软件的门槛是越来越低了,毕竟纯
intel系统上的编程更通用,intel+CUDA编程次之,intel+OpenCL再次之。
对个人计算来说,超算太遥远,但是超算的单个计算节点我们个人配计算用的机器是可
以参考的。
在建的美国超算,每个计算节点: 2个Intel Xeon 12 cores CPU,128GB RAM,800GB
SSD;
“天河二号”,每个计算节点: 2个Intel Xeon 12 cores CPU,64GB RAM,外加3个
Intel Xeon phi计算卡;
“天河一号A”,每个计算节点: 2个Intel Xeon 8 cores CPU,32GB RAM,外加1个NV
Tesla计算卡;
“天河一号”,每个计算节点: 1个Intel Xeon 4 cores CPU,16GB RAM,外加1个AMD
显卡加速;
美国橡树岭“泰坦”,每个计算节点: 1个AMD Opteron 16 cores CPU,32GB RAM,外
加1个NV Tesla计算卡;
再加上apple的MAC pro,每个桶:1个Intel Xeon CPU,16GB RAM,外加2个AMD显卡加
速;
所以,个人配计算用的机器,
如果超级有米的话, 2个Intel Xeon CPU,128GB RAM,外加2个Intel Xeon phi或者NV
Tesla计算卡;
米次之,可以考虑没有ECC内存校验的版本,那就是普通的intel i7 CPU + 32GB/64GB +
一块或2块NV GTX Titan计算加速卡。
米还是不足,那就只能上AMD/intel CPU+AMD显卡加速了。

【在 x********o 的大作中提到】
: GTX的比AMD的好,主要是cuda提供了很多方便,像BLAS一类的用现成的就行了。AMD系
: 列的没有cuda这样的。

avatar
f*r
33
比同频i7便宜多了。当然能用非ecc的。

【在 b*********n 的大作中提到】
: 擦,server cpu可不便宜啊!而且这玩意儿能用non ecc内存吗?
avatar
S*n
34
Intel Xeon加non-ECC内存,就没有ECC功能了。不用ECC功能,不如上普通haswell i7.
(要考虑到主板价格。)
我的建议是,如果上Xeon,就上全套ECC的东西,ECC内存,ECC专业显卡,就像apple
Mac Pro大圆桶那样。
不上ECC,就都不上ECC,普通家用的很了好了,haswell i7 + non-ECC DDR3 RAM +
GTX titan。
配什么样的机器基本上是由多少米决定的。

【在 f*******r 的大作中提到】
: 比同频i7便宜多了。当然能用非ecc的。
avatar
E*e
35
请问能配合AMD+OpenCL使用的
类似CUDA Math的library有什么比较好的?
谢谢!

【在 S******n 的大作中提到】
: 有钱就买Telsa 或 Titan。
: 没钱就只能AMD OpenCL了,这两年OpenCL应用也不少了。从两年前的几款应用到现在的
: 好几千款应用了~~~
: 现在intel,apple都提供了对OpenCL的支持吧,特别是apple,不遗余力的。
: apple的Mac pro大圆桶就是异构计算的典型配置,可以参考一下。
: http://store.apple.com/us/buy-mac/mac-pro
: OpenCL是提供了API接口,可以在C++里调用这些SDK。
: 不过CUDA更底层一些,软件和驱动成熟一些,毕竟软件上耕耘的时间更长,编程灵活一
: 些。
: 用CUDA搞计算,PGI Visual Fortran 少不了,google一下盗版就有下载的。

avatar
E*e
36
大概七八年前,连计算流体都是单精度
因为内存不够
现在的应用我完全不介意由于硬件限制回到单精度上

【在 S******n 的大作中提到】
: 那还是打游戏吧。游戏渲染就只用单精度。
avatar
S*n
37
用单精度的话,上两块GTX 780吧。现在降价了,性价比不错。
GTX 7系列,双精度是单精度的 1/24 (理论值是1/3,阉割了)
其实如果不上titan,GTX 580的双精度在NV民用卡中是最强的。只是现在我不知道哪里
有廉价GTX 580卖。
NV 费米 双精度理论上是单精度的 1/2;
NV 开普勒 双精度理论上是单精度的 1/3;
NV 麦克斯韦 双精度理论上是单精度的 1/4;(麦克斯韦要集成ARM处理器,ARM参与调
度)
AMD R9 290X/290也阉割了双精度了,只有单精度的1/8 (理论值应该是1/2,阉割了)。
倒是7990、7970的双精度是完全的,是单精度的1/4(理论值也是1/4)。
用游戏卡搞计算,单精度AMD和NV其实都差不多。
双精度目前是NV阵营 Titan > 580 > 780; AMD阵营 7970 > 290X

【在 E***e 的大作中提到】
: 大概七八年前,连计算流体都是单精度
: 因为内存不够
: 现在的应用我完全不介意由于硬件限制回到单精度上

avatar
S*n
38
OpenCL从几款应用到现在几千款应用,也是最近两年的事情。
七八年前很遥远了~~~七八年前CUDA如日中天,OpenCL是狗屎。

【在 E***e 的大作中提到】
: 大概七八年前,连计算流体都是单精度
: 因为内存不够
: 现在的应用我完全不介意由于硬件限制回到单精度上

avatar
E*e
39
哪里能看到几千款应用的好评度神码的?
对C++不算很熟,最好能有documentation比较好的library。。。

【在 S******n 的大作中提到】
: OpenCL从几款应用到现在几千款应用,也是最近两年的事情。
: 七八年前很遥远了~~~七八年前CUDA如日中天,OpenCL是狗屎。

avatar
l*o
40
如果要搞一个个人计算的台式机做科学计算,需要双精度,既有满矩阵,又有稀疏矩阵
。是自己配好,还是买戴尔的 T5600 比较好?
自己配的话,cooling system 和 主板 怎么选比较好? 买的话,能拿到更好的折扣吗
avatar
x*o
41
条条大路是通罗马,问题是对大部分人来说这玩意就是一个工具,花太多时间精力去调
试优化代码不值得,还不如有现成的支持快。

【在 S******n 的大作中提到】
: 有钱就买Telsa 或 Titan。
: 没钱就只能AMD OpenCL了,这两年OpenCL应用也不少了。从两年前的几款应用到现在的
: 好几千款应用了~~~
: 现在intel,apple都提供了对OpenCL的支持吧,特别是apple,不遗余力的。
: apple的Mac pro大圆桶就是异构计算的典型配置,可以参考一下。
: http://store.apple.com/us/buy-mac/mac-pro
: OpenCL是提供了API接口,可以在C++里调用这些SDK。
: 不过CUDA更底层一些,软件和驱动成熟一些,毕竟软件上耕耘的时间更长,编程灵活一
: 些。
: 用CUDA搞计算,PGI Visual Fortran 少不了,google一下盗版就有下载的。

avatar
S*n
43
http://configure.us.dell.com/dellstore/config.aspx?oc=swct563&m
自己配类似性能的机器,显卡也不便宜吧。
你可以尝试用newegg的价格配台类似的配置,看谁便宜。(CPU选xeon,内存选ECC的服
务器内存)

【在 l*****o 的大作中提到】
: 如果要搞一个个人计算的台式机做科学计算,需要双精度,既有满矩阵,又有稀疏矩阵
: 。是自己配好,还是买戴尔的 T5600 比较好?
: 自己配的话,cooling system 和 主板 怎么选比较好? 买的话,能拿到更好的折扣吗
: ?

avatar
l*o
44
主板和制冷呢?

【在 S******n 的大作中提到】
: http://configure.us.dell.com/dellstore/config.aspx?oc=swct563&m
: 自己配类似性能的机器,显卡也不便宜吧。
: 你可以尝试用newegg的价格配台类似的配置,看谁便宜。(CPU选xeon,内存选ECC的服
: 务器内存)

avatar
E*e
47
貌似市面上所有的都可以,问题就是性能怎样
游戏卡单精度计算都还好,双精度就比cpu没什么优势了
真想玩双精度,要买专业计算用的Tesla神码的,单双性能比3:1
刚才牛人推荐GTX Titan也基本有3:1的水平,但是titan的flops比tesla还是差不少

【在 l*****o 的大作中提到】
: NVIDIA 哪些卡可以用 CUDA 做并行计算啊? 这些卡对其他部分有什么特殊要求吗?
avatar
z*i
48
GTX titan其实就是没有ECC内存校验的Tesla K20x卡,基本的flops是一样的,都是单
精度3.9 Tflops,双精度1.3 Tflops。
没有内存校验,这么多核,只要有一个算错了,计算结果就错了。
为了防止这点,就需要采用比较好的厚的全塔机箱。

【在 E***e 的大作中提到】
: 貌似市面上所有的都可以,问题就是性能怎样
: 游戏卡单精度计算都还好,双精度就比cpu没什么优势了
: 真想玩双精度,要买专业计算用的Tesla神码的,单双性能比3:1
: 刚才牛人推荐GTX Titan也基本有3:1的水平,但是titan的flops比tesla还是差不少

avatar
E*e
49
小白求问机箱和内存错误之间什么关系?

【在 z******i 的大作中提到】
: GTX titan其实就是没有ECC内存校验的Tesla K20x卡,基本的flops是一样的,都是单
: 精度3.9 Tflops,双精度1.3 Tflops。
: 没有内存校验,这么多核,只要有一个算错了,计算结果就错了。
: 为了防止这点,就需要采用比较好的厚的全塔机箱。

avatar
l*o
50
TITAN 一千块还可以接受,特斯拉 3500 块太贵了。
谁能解释一下这个差别

【在 E***e 的大作中提到】
: 貌似市面上所有的都可以,问题就是性能怎样
: 游戏卡单精度计算都还好,双精度就比cpu没什么优势了
: 真想玩双精度,要买专业计算用的Tesla神码的,单双性能比3:1
: 刚才牛人推荐GTX Titan也基本有3:1的水平,但是titan的flops比tesla还是差不少

avatar
l*o
51
同问

【在 E***e 的大作中提到】
: 小白求问机箱和内存错误之间什么关系?
avatar
z*i
52
其实AMD显卡的双精度更好,问题在于功耗不好,散热不好,所以集群时很少采用AMD的
卡。(集群计算的卡一般都是不带风扇靠散热片散热的。靠大空调。)
跟AMD R9 290X对应的专业显卡,单精度 5.6 Tflops,双精度2.8 Tflops, 价格$4000
以上吧。(290X自己是单精度5.6 Tflops,双精度700 Gflops。)
跟AMD Radeon™ HD 7970对应的专业显卡是AMD FirePro™ W9000。 (两者
性能都是单精度 4.0 Tflops,双精度1.0 Tflops)前者价格300美元,后者价格3500美
元。差别主要是ECC校验和驱动程序。
http://www.amd.com/US/PRODUCTS/WORKSTATION/GRAPHICS/ATI-FIREPRO
GTX Titan跟Tesla K20X的关系也是这样的,GTX Titan卖$999,Tesla K20X卖$3499。
avatar
E*e
53
主要差别就在内存校验吧
我觉得个人 prototyping 目的的话titan足够了
商业production还是要搞tesla

【在 l*****o 的大作中提到】
: TITAN 一千块还可以接受,特斯拉 3500 块太贵了。
: 谁能解释一下这个差别

avatar
l*o
54
可惜我不会 OpenCL

4000

【在 z******i 的大作中提到】
: 其实AMD显卡的双精度更好,问题在于功耗不好,散热不好,所以集群时很少采用AMD的
: 卡。(集群计算的卡一般都是不带风扇靠散热片散热的。靠大空调。)
: 跟AMD R9 290X对应的专业显卡,单精度 5.6 Tflops,双精度2.8 Tflops, 价格$4000
: 以上吧。(290X自己是单精度5.6 Tflops,双精度700 Gflops。)
: 跟AMD Radeon™ HD 7970对应的专业显卡是AMD FirePro™ W9000。 (两者
: 性能都是单精度 4.0 Tflops,双精度1.0 Tflops)前者价格300美元,后者价格3500美
: 元。差别主要是ECC校验和驱动程序。
: http://www.amd.com/US/PRODUCTS/WORKSTATION/GRAPHICS/ATI-FIREPRO
: GTX Titan跟Tesla K20X的关系也是这样的,GTX Titan卖$999,Tesla K20X卖$3499。

avatar
z*i
55
机箱足够厚可以减轻宇宙射线带来的内存数值翻转,同时有更好的电磁屏蔽。

【在 E***e 的大作中提到】
: 小白求问机箱和内存错误之间什么关系?
avatar
E*e
56
宇宙射线膜拜了

【在 z******i 的大作中提到】
: 机箱足够厚可以减轻宇宙射线带来的内存数值翻转,同时有更好的电磁屏蔽。
avatar
E*e
57
什么开发目的?
C++配上一两个library不够用?

【在 l*****o 的大作中提到】
: 可惜我不会 OpenCL
:
: 4000

avatar
E*e
59
请问GT780单精度浮点能有5046GFLOPS这个不是超过TESLA K20了?
不考虑ECC的话。。。

【在 z******i 的大作中提到】
: openCL 2008年才开始的。
: http://zh.wikipedia.org/wiki/OpenCL

avatar
z*i
60
呵呵,这个是避免不了的。所以只能靠冗余和ECC校验纠正。
服务器上可靠性很重要的,万一出错后果很严重。
个人用一两块GTX titan配厚一点的机箱,发生错误的几率不比带ECC校验的超级计算机
更大。
当然,如果搞上几千块几万块GTX titan,那宇宙射线导致翻转的几率就不能忽视了。

【在 E***e 的大作中提到】
: 宇宙射线膜拜了
avatar
z*i
61
是的。

【在 E***e 的大作中提到】
: 请问GT780单精度浮点能有5046GFLOPS这个不是超过TESLA K20了?
: 不考虑ECC的话。。。

avatar
E*e
62
那就回头整个这货prototyping玩
反正单精度对我足够了

【在 z******i 的大作中提到】
: 是的。
avatar
z*i
63
别忘记了到时整个PGI Visual Fortran

我机器的E盘倒是有,网上应该有不少下载的。
E:PGI

├─PGI.Visual.Fortran.2008.v11.9
│ │ crack.7z
│ │ pgivf-vs2008-119.exe
│ │ pgivfx64-vs2008-119.exe
│ │
│ └─crack
│ install.txt
│ license.dat
│ pgi-vf32-patch.7z
│ pgi-vf64-patch.7z
│ pgi-vs-patch.7z

├─PGI.Visual.Fortran.2010.v11.9
│ │ crack.7z
│ │ pgivf-vs2010-119.exe
│ │ pgivfx64-vs2010-119.exe
│ │
│ └─crack
│ install.txt
│ license.dat
│ pgi-vf32-patch.7z
│ pgi-vf64-patch.7z

├─PGI.Visual.Fortran.2010.v11.9.with.VS2010.Shell
│ │ crack.7z
│ │ pgivf-vs2010all-119.exe
│ │ pgivfx64-vs2010all-119.exe
│ │
│ └─crack
│ install.txt
│ license.dat
│ pgi-vf32-patch.7z
│ pgi-vf64-patch.7z
│ pgi-vs-patch.7z

├─PGI.Visual.Fortran.v13.9
│ pvf32-139.exe
│ pvf64-139.exe

├─PGI.Visual.Fortran.v13.9.Win2k3
│ pvf32-xp-139.exe
│ pvf64-xp-139.exe

├─PGI.Visual.Fortran.v13.9.with.VS.Shell
│ pvf32-shell-139.exe
│ pvf64-shell-139.exe

├─PGI.Workstation.Complete.v11.9
│ │ crack.7z
│ │ pgiws-119.exe
│ │ pgiwsx64-119.exe
│ │
│ └─crack
│ install.txt
│ license.dat
│ pgi-ws32-patch.7z
│ pgi-ws64-patch.7z

├─PGI.Workstation.Complete.v13.9
│ pgiws32-139.exe
│ pgiws64-139.exe

├─PGI.Workstation.Complete.v13.9.Linux
│ pgilinux-2013-139.tar.gz

├─PGI.Workstation.Complete.v13.9.OSX
│ PGI-Workstation-139.dmg

└─PGI.Workstation.Complete.v13.9.Win2k3
pgiws32-xp-139.exe
pgiws64-xp-139.exe


【在 E***e 的大作中提到】
: 那就回头整个这货prototyping玩
: 反正单精度对我足够了

avatar
l*o
64
看了一下,好像 Intel Xeon PHI 基本可以代替 NVIDIA TESLA 啊,价格便宜不少吧。
有谁了解吗?
avatar
S*n
65
Xeon PHI这个东西源于失败了的intel独立显卡项目Larrabee。
当年,intel想在一张卡上集成上百个intel x86 CPU,想做通用独立显卡,跟老黄的费
米显卡竞争,因为没法控制发热量,Larrabee项目失败了。(老黄那时天天笑intel
Laugh——a——bee~~~)
2009年5月
http://www.pcpop.com/doc/0/398/398280.shtml
2010年5月
http://www.enet.com.cn/article/2010/0526/A20100526659291.shtml
但是intel毕竟投了很多钱,完全放弃又舍不得,最后抬头换面做计算加速卡,这就是
Intel Xeon PHI。
现在Intel Xeon PHI就是一张卡集成60+的586 1GHz CPU, 8GB RAM, 主要做并行计算加
速,双精度能到 1.x Tfls。

【在 l*****o 的大作中提到】
: 看了一下,好像 Intel Xeon PHI 基本可以代替 NVIDIA TESLA 啊,价格便宜不少吧。
: 有谁了解吗?

avatar
E*e
66
别笑话我土,一直没搞明白
cuda math不是cuda c上的么?
为什么fortran会跳出来?

【在 z******i 的大作中提到】
: 别忘记了到时整个PGI Visual Fortran
:
: 我机器的E盘倒是有,网上应该有不少下载的。
: E:PGI
: │
: ├─PGI.Visual.Fortran.2008.v11.9
: │ │ crack.7z
: │ │ pgivf-vs2008-119.exe
: │ │ pgivfx64-vs2008-119.exe
: │ │

avatar
S*n
67
Visual Fortran和Visual C++是同一界面,数值计算还是使用Fortran的多。
编译使用起来应该是一样的。

【在 E***e 的大作中提到】
: 别笑话我土,一直没搞明白
: cuda math不是cuda c上的么?
: 为什么fortran会跳出来?

avatar
E*e
68
那cuda c + cuda BLAS + cuda MATH有什么劣势?
仅仅是速度么?
现在行业应用fortran已经比较困难了
就算我愿意,老板客户也不愿意
招不到搞这货的人,OO也不方便

【在 S******n 的大作中提到】
: Visual Fortran和Visual C++是同一界面,数值计算还是使用Fortran的多。
: 编译使用起来应该是一样的。

avatar
S*n
69
没关系啊,反正有Visual Fortran的地方多半同时存在Visual C++,
用C++编程就是了。

【在 E***e 的大作中提到】
: 那cuda c + cuda BLAS + cuda MATH有什么劣势?
: 仅仅是速度么?
: 现在行业应用fortran已经比较困难了
: 就算我愿意,老板客户也不愿意
: 招不到搞这货的人,OO也不方便

avatar
E*e
70
就是说在PGI Visual Fortran里写C++代码,然后调用cuda BLAS和MATH?

【在 S******n 的大作中提到】
: 没关系啊,反正有Visual Fortran的地方多半同时存在Visual C++,
: 用C++编程就是了。

avatar
l*o
71
关键是能替代 NVIDIA 的特斯拉吗?网上好像没有结论

【在 S******n 的大作中提到】
: Xeon PHI这个东西源于失败了的intel独立显卡项目Larrabee。
: 当年,intel想在一张卡上集成上百个intel x86 CPU,想做通用独立显卡,跟老黄的费
: 米显卡竞争,因为没法控制发热量,Larrabee项目失败了。(老黄那时天天笑intel
: Laugh——a——bee~~~)
: 2009年5月
: http://www.pcpop.com/doc/0/398/398280.shtml
: 2010年5月
: http://www.enet.com.cn/article/2010/0526/A20100526659291.shtml
: 但是intel毕竟投了很多钱,完全放弃又舍不得,最后抬头换面做计算加速卡,这就是
: Intel Xeon PHI。

avatar
E*e
72
我觉得还是算了吧
搞个GTX 780 TI比这靠谱,才700块。。。

【在 l*****o 的大作中提到】
: 关键是能替代 NVIDIA 的特斯拉吗?网上好像没有结论
avatar
S*n
73
我的理解是,必须有微软的Visual studio才能装上visual Fortran,装完了Fortran就
成了Visual studio的一部分。
至于visual studio用什么语言,怎么调用CUDA加速,没必要操心太多吧。CUDA肯定是
对C++和Fortran同时起作用的。

【在 E***e 的大作中提到】
: 就是说在PGI Visual Fortran里写C++代码,然后调用cuda BLAS和MATH?
avatar
E*e
74
长知识了
回头试试看
多谢了

【在 S******n 的大作中提到】
: 我的理解是,必须有微软的Visual studio才能装上visual Fortran,装完了Fortran就
: 成了Visual studio的一部分。
: 至于visual studio用什么语言,怎么调用CUDA加速,没必要操心太多吧。CUDA肯定是
: 对C++和Fortran同时起作用的。

avatar
S*n
75
显然是啊,否则"天河二号"不用NVIDIA 的特斯拉而用intel的phi?
"天河一号A"和橡树岭的"泰坦"都是用NV telsa加速的。
用intel的phi降低了编程成本同时提高了通用性吧,因为phi说白了就是一堆现代工艺
的586。
你看,telsa都没有显示器接口。
http://www.newegg.com/Product/Product.aspx?Item=N82E16814132008

【在 l*****o 的大作中提到】
: 关键是能替代 NVIDIA 的特斯拉吗?网上好像没有结论
avatar
l*o
76
我的需要双精度浮点运算,这个能行吗,我前面看的最少也需要 Quadro 4000 才行。

【在 E***e 的大作中提到】
: 我觉得还是算了吧
: 搞个GTX 780 TI比这靠谱,才700块。。。

avatar
l*o
77
我仔细看了下,好像据说对于本身就非常平行的程序,比如蒙特卡洛,ray tracing 之
类的,特斯拉还是好不少。
但是对于不是本身就很平行的东西,比如稀疏矩阵乘法之类的,phi 比特斯拉好不少。

【在 S******n 的大作中提到】
: 显然是啊,否则"天河二号"不用NVIDIA 的特斯拉而用intel的phi?
: "天河一号A"和橡树岭的"泰坦"都是用NV telsa加速的。
: 用intel的phi降低了编程成本同时提高了通用性吧,因为phi说白了就是一堆现代工艺
: 的586。
: 你看,telsa都没有显示器接口。
: http://www.newegg.com/Product/Product.aspx?Item=N82E16814132008

avatar
S*n
78
自己配吧,Haswell i7-4770K, 32GB DDR3, 外加一块GTX Titan显卡加速或者两块。

【在 l*****o 的大作中提到】
: 我的需要双精度浮点运算,这个能行吗,我前面看的最少也需要 Quadro 4000 才行。
avatar
S*n
79
那是,要是当年搞好了蒙特卡洛,ray tracing, Phi就是独立显卡larraabee了。
特斯拉去掉ECC加个显示接口,就是正规的显卡——gtx titan了。
毕竟一个是失败的显卡,一个是成功的显卡加强。
蒙特卡洛,AMD显卡更强

【在 l*****o 的大作中提到】
: 我仔细看了下,好像据说对于本身就非常平行的程序,比如蒙特卡洛,ray tracing 之
: 类的,特斯拉还是好不少。
: 但是对于不是本身就很平行的东西,比如稀疏矩阵乘法之类的,phi 比特斯拉好不少。

avatar
E*e
80
双精度不怎么行
用titan好了

【在 l*****o 的大作中提到】
: 我的需要双精度浮点运算,这个能行吗,我前面看的最少也需要 Quadro 4000 才行。
avatar
E*e
81
确实很想上AMD
可是AMD上到底用什么MATH和MATRIX的library?
看了半天也还是不明白

【在 S******n 的大作中提到】
: 那是,要是当年搞好了蒙特卡洛,ray tracing, Phi就是独立显卡larraabee了。
: 特斯拉去掉ECC加个显示接口,就是正规的显卡——gtx titan了。
: 毕竟一个是失败的显卡,一个是成功的显卡加强。
: 蒙特卡洛,AMD显卡更强

avatar
S*n
82
GTX 780Ti 双精度是不怎么行,但是还是比intel的四核CPU快的多啊~~呵呵

【在 E***e 的大作中提到】
: 双精度不怎么行
: 用titan好了

avatar
l*o
83
我的应用中一大部分就是稀疏矩阵乘法,另外一大部分就是满矩阵乘法。像蒙特卡罗这
种天生平行的算法很少,所以我不太能确定。。。

【在 S******n 的大作中提到】
: 那是,要是当年搞好了蒙特卡洛,ray tracing, Phi就是独立显卡larraabee了。
: 特斯拉去掉ECC加个显示接口,就是正规的显卡——gtx titan了。
: 毕竟一个是失败的显卡,一个是成功的显卡加强。
: 蒙特卡洛,AMD显卡更强

avatar
E*e
84
我这种天天就在搞暴力MC重复计算的实在是太幸福了 lol

【在 l*****o 的大作中提到】
: 我的应用中一大部分就是稀疏矩阵乘法,另外一大部分就是满矩阵乘法。像蒙特卡罗这
: 种天生平行的算法很少,所以我不太能确定。。。

avatar
S*n
85
找个AMD的显卡驱动看里面的OpenCL SDK?
感觉AMD软件上很偷懒,舍不得投入。
CUDA里面的数学库很庞大的。

【在 E***e 的大作中提到】
: 确实很想上AMD
: 可是AMD上到底用什么MATH和MATRIX的library?
: 看了半天也还是不明白

avatar
E*e
86
就找到了BLAS的,还是今年刚发布的
找了半天连个函数列表都没有
按理说数学函数的sdk应该很好找
可是居然就没搜到个靠谱的
反正跟cuda一比,心凉了半截。。。

【在 S******n 的大作中提到】
: 找个AMD的显卡驱动看里面的OpenCL SDK?
: 感觉AMD软件上很偷懒,舍不得投入。
: CUDA里面的数学库很庞大的。

avatar
S*n
87
别提了,据说AMD卡双精度只有IEEE里面最基本的计算,双精度函数部分,没有写,号
称自定义能力强。
也就是说,函数功能超级不全,不提供现成的。当然,自己是可以写,可是谁有闲心重
新把这些函数写一遍啊。
也就是说,只要是加减乘除,AMD双精度OK,涉及函数,傻眼。NV就省心多了,很多函
数都定义好了。

【在 E***e 的大作中提到】
: 就找到了BLAS的,还是今年刚发布的
: 找了半天连个函数列表都没有
: 按理说数学函数的sdk应该很好找
: 可是居然就没搜到个靠谱的
: 反正跟cuda一比,心凉了半截。。。

avatar
E*e
88
那我还是老老实实在CUDA的世界里晃悠一阵吧
很多函数就算自己写,也没法把性能最优化啊,那是要很多功夫的


【在 S******n 的大作中提到】
: 别提了,据说AMD卡双精度只有IEEE里面最基本的计算,双精度函数部分,没有写,号
: 称自定义能力强。
: 也就是说,函数功能超级不全,不提供现成的。当然,自己是可以写,可是谁有闲心重
: 新把这些函数写一遍啊。
: 也就是说,只要是加减乘除,AMD双精度OK,涉及函数,傻眼。NV就省心多了,很多函
: 数都定义好了。

avatar
w*g
90
我配过cuda的, 看你用多少了,用的不是很多的话 如果租amazon的一千块能用成百上
前小时了

CPU
4

【在 b*********n 的大作中提到】
: 打算在感恩节前后装个新机器计算用.主要用GPU计算,显卡用GTX 7系列或者6系列.CPU
: 要求不高,主要是日常处理,最多做一些测试,matlab之类的.
: 求建议用什么CPU? 希望物美价廉性价比高一些,4核最好.现在我考虑用AMD的FX系列,4
: 核100一下能解决问题.不想用intel主要是因为价钱高,而且整合gpu我也不需要.

avatar
E*e
91
这种也就是玩玩
真要上战场拿着这么一把枪我还是要抖的

【在 S******n 的大作中提到】
: open CL toolbox for matlab下载地址:
: https://code.google.com/p/opencl-toolbox/

avatar
z*i
92
一千块就自己买个titan了~~~

【在 w****g 的大作中提到】
: 我配过cuda的, 看你用多少了,用的不是很多的话 如果租amazon的一千块能用成百上
: 前小时了
:
: CPU
: 4

avatar
l*o
93
不知道 NVIDIA 以前的 TESLA c2050 c1060 之类,是不是应该够用了。
avatar
i*t
94
好看上面的帖子 我想说 老金 小姐 能帮我推荐个配置吗!多谢了!
我的要求 价格700左右 最好gtx的卡 不知道i5够不够用?
请推荐啊 小金 好牛x
avatar
i*t
95
我觉得还是用cuda吧 当然我也是新手 我觉得他是现在比较方便的 学习和使用
既然学习工作 就不要太在机器上给自己找不痛快了
avatar
S*n
96
显卡选GTX 760吧这个$250,然后450配台机器。
其实等dell oulet有deal时450能抢到台式机i7的配置。
自己配要等deal吧。

【在 i******t 的大作中提到】
: 好看上面的帖子 我想说 老金 小姐 能帮我推荐个配置吗!多谢了!
: 我的要求 价格700左右 最好gtx的卡 不知道i5够不够用?
: 请推荐啊 小金 好牛x

avatar
i*t
97
450的 dell i7机器那主板能放 760吗?
ps 450 貌似太夸张了 我觉得550 还算是靠谱的 450 基本上抢不到。。。
我也觉得760 现在看还不错 性价比比较高
580也好 但是貌似现在市场基本上没有啦。。

【在 S******n 的大作中提到】
: 显卡选GTX 760吧这个$250,然后450配台机器。
: 其实等dell oulet有deal时450能抢到台式机i7的配置。
: 自己配要等deal吧。

avatar
c*t
98
ecc普通没用啊,服务器主板各种稳定性,配件性能都好,不光是ecc

i7.

【在 S******n 的大作中提到】
: Intel Xeon加non-ECC内存,就没有ECC功能了。不用ECC功能,不如上普通haswell i7.
: (要考虑到主板价格。)
: 我的建议是,如果上Xeon,就上全套ECC的东西,ECC内存,ECC专业显卡,就像apple
: Mac Pro大圆桶那样。
: 不上ECC,就都不上ECC,普通家用的很了好了,haswell i7 + non-ECC DDR3 RAM +
: GTX titan。
: 配什么样的机器基本上是由多少米决定的。

avatar
S*n
99
所以说上haswell i7-4770K么,很多服务器6核CPU性能都打不过i7-4770K。

【在 c****t 的大作中提到】
: ecc普通没用啊,服务器主板各种稳定性,配件性能都好,不光是ecc
:
: i7.

avatar
t*t
100
正常功率的6核Xeon,还是不惧4770K的。

【在 S******n 的大作中提到】
: 所以说上haswell i7-4770K么,很多服务器6核CPU性能都打不过i7-4770K。
avatar
S*n
101
日常应用就是连4960X都不如4770K快,这是有评测的,intel自己承认的。

【在 t**t 的大作中提到】
: 正常功率的6核Xeon,还是不惧4770K的。
avatar
t*t
102
当然了。SuperPI之类的单线程比的是频率。

【在 S******n 的大作中提到】
: 日常应用就是连4960X都不如4770K快,这是有评测的,intel自己承认的。
avatar
S*n
103
88楼,凑个吉利~~~
avatar
S*n
104
AMD异构计算的SDK千呼万唤始出来~~~~~~~~
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
即将发布的Kaveri APU会把异构计算推向一个全新的高度,而要想充分发挥硬件优势,
开发环境必须跟随到位。今天的APU13开发者峰会上,AMD就宣布了全新的一体化SDK开
发包,以及改进的CodeXL工具。
AMD APP SDK v2.9:
有史以来最为用户友好的异构计算SDK,增加了多项简单易用、高效开发的新特性,比
如基于Web的简单浏览器,可轻松查找工程示例;增加支持CMake,一个流行的跨平台安
装(编译)工具;新增Visual Studio插件,改进OpenCL源编辑;一些新的示例,展示如
何以最小代价优化OpenCV、Bolt等开源库从而获得加速性能。
操作系统支持Windows 7/8/8.1、Linux 32/64位,后者包括openSUSE 11.x, Ubuntu 10
.x, Red Hat Enterprise Linux 6.x,驱动需要催化剂13.11 Beta。
官方下载:
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
Media SDK v1.0:
这是该开发包第一次公开发布,用于AMD产品多媒体特性的开发,比如GPU加速的视频预
处理、后期处理库,低延迟视频编码库。
操作系统支持Windows 7/8/8.1 32/64位,驱动需要催化剂13.9。
官方下载:
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
SDK还在多个开源库内增加了多项异构加速优化,包括OpenCV增加了大量OpenCL加速功
能,clMath拥有了BLAS、FFT库,并支持Fortran、C、C++,数据并行算法GPU加速的C++
模板库Bolt跨平台了,并有很多性能改进和新特性。
CodeXL v1.3:
现在支持Java了!还集成了静态内核分析功能,支持远程调试、配置,并支持GCN架构
GPU、APU。
操作系统支持Windows 7/8/8.1 32/64位、Ubuntu 12.04+ 64位、Red Hat Enterprise
Linux 6.x 64位,开发环境需要Visual Studio 2010/2012,驱动需要催化剂13.9。
官方下载:
http://developer.amd.com/tools-and-sdks/heterogeneous-computing
AMD表示,将最终会让开发者非常方便地访问其产品的所有可编程模块,而且要跨平台
、跨系统、跨厂商、跨语言,这些努力只是第一步,而且还会继续贡献给开源社区。
avatar
S*n
105
AMD SDK 终于有了,不是那把小枪了,呵呵~~~

【在 E***e 的大作中提到】
: 这种也就是玩玩
: 真要上战场拿着这么一把枪我还是要抖的

avatar
E*e
106
可是cuda math在amd上到底对应哪个?
clmath文档看了半天也没几个函数啊?

【在 S******n 的大作中提到】
: AMD SDK 终于有了,不是那把小枪了,呵呵~~~
avatar
a*s
107
http://www.eecs.berkeley.edu/~sangjin/2013/02/12/CPU-GPU-compar
看看这篇文章吧,还有里面的一篇paper
gpu没有你想的那么神
就算cuda 上千核,执行效率应该还是cpu高
而且,只是特定的应用,
code都优化的话,cpu和gpu比,没有差的那么离谱

【在 b*********n 的大作中提到】
: cpu拼不过gpu.
: 计算肯定是gpu了,上千个cuda核。现在需要一块性价比好的cpu,4核最好,处理日常
: 工作。

avatar
a*s
109
呵呵,我没有说cpu好,
我只是提一个醒,
gpu有点hyper
个人感觉

【在 E***e 的大作中提到】
: CPU和GPU都是各有优劣
: 偏向哪一方的论调都有失偏颇
: http://www.walkingrandomly.com/?p=3736

avatar
E*e
110
hyper不hyper,全看应用
有些应用就是独立线程的简单计算暴力重复
拼时间不拼技术
GPU用上就很合适

【在 a*s 的大作中提到】
: 呵呵,我没有说cpu好,
: 我只是提一个醒,
: gpu有点hyper
: 个人感觉

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。