请问有没有Nvidia GPU在CUDA上计算的benchmark - 未名空间MITBBS历史存档

国际科技财经博客移民网络热点娱乐民生时事公众号

Redian新闻

>未名空间

>Hardware - 计算机硬件

请问有没有Nvidia GPU在CUDA上计算的benchmark

请问有没有Nvidia GPU在CUDA上计算的benchmark# Hardware - 计算机硬件

w*r2013-11-17 08:11

1 楼

请大家帮忙提供一个最近的移民所要打的疫苗名字。想在中国办个证明，看看哪个已经
打过，就不用打了。需要给＞18岁的成人那个。多谢了。

J*L2013-11-17 08:11

2 楼

一帮热血男儿，一袭绿军装，腰板挺直，身体强健，说话声音嘹亮，走路稳健如飞，是
多少热血男儿的梦想。
https://www.youtube.com/watch?v=ExAHwzdmewE
https://www.youtube.com/watch?v=A3OKZB-gCRk

c*a2013-11-17 08:11

3 楼

好久没灌水了，大家还好么？
上个月底因为贪狗拉肚子去了兽医那里。被狠狠宰了350刀，啥也没查出来，给的药也
没啥用，就不一一赘述了。反正趁机会查了下heart worm，没查出来，刚好可以上药了
。兽医给开了heartgard,$57，6个月的包装，一年要$114。我怒了，说没钱了，我网上
买到时候你给网上商店fax处方就好了。
昨天看了一圈儿之后在petcareRx买的。51-100磅，12个月的包装，$63.19，没税没
shipping。网站上价格是$78.99，但是我看太贵想离开页面的时候（点后退），跳出窗
口说给20%off，产品页面价格不变但是check out的时候就减掉了20%。
另外我很cheap的想，既然一片药可以管到100磅，而贪狗不到60磅，那么是不是可以把
每片药切掉1/3，这样就可以两片药吃三个月了？？可行么？

E*e2013-11-17 08:11

4 楼

具体到Monte Carlo的最好
类似这样的
找到的benchmark全都是在OpenCL上跑NV，明显不太公平
所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark
问题问到再具体不过了，请那些不懂的不要进来犯贱扯什么CPU，优化，挖矿，dense
matrix, hyper之类不着边的东西。
我就是问NV GPU在CUDA上的benchmark，最好是Monte Carlo，谢谢！

i*u2013-11-17 08:11

5 楼

下载一个i-693表格就知道了吧，加上看皮匠的博客

m*j2013-11-17 08:11

6 楼

这妈当的！
HEARTGUARD是不是和INTERCEPTOR一样？

S*n2013-11-17 08:11

7 楼

算Monte Carlo还是AMD的卡好。
CUDA对AMD的唯一优势就是定义了一堆科学计算的函数。
只要不涉及复杂的包含函数的科学计算，一般都是AMD的显卡快。特别是像金融计算、
密码学计算。

【在 E***e 的大作中提到】

: 具体到Monte Carlo的最好
: 类似这样的
: 找到的benchmark全都是在OpenCL上跑NV，明显不太公平
: 所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark
: 问题问到再具体不过了，请那些不懂的不要进来犯贱扯什么CPU，优化，挖矿，dense
: matrix, hyper之类不着边的东西。
: 我就是问NV GPU在CUDA上的benchmark，最好是Monte Carlo，谢谢！

h*r2013-11-17 08:11

8 楼

我的医生要求打：
MMR（要求两针，我以前打过一针，所以又打一针）
水痘（要求两针，我以前得过，所以不用打）
破伤风（？？记不清料，以前打过，所以没打）

【在 w********r 的大作中提到】

: 请大家帮忙提供一个最近的移民所要打的疫苗名字。想在中国办个证明，看看哪个已经
: 打过，就不用打了。需要给＞18岁的成人那个。多谢了。

m*h2013-11-17 08:11

9 楼

南加没必要

【在 c*****a 的大作中提到】

: 好久没灌水了，大家还好么？
: 上个月底因为贪狗拉肚子去了兽医那里。被狠狠宰了350刀，啥也没查出来，给的药也
: 没啥用，就不一一赘述了。反正趁机会查了下heart worm，没查出来，刚好可以上药了
: 。兽医给开了heartgard,$57，6个月的包装，一年要$114。我怒了，说没钱了，我网上
: 买到时候你给网上商店fax处方就好了。
: 昨天看了一圈儿之后在petcareRx买的。51-100磅，12个月的包装，$63.19，没税没
: shipping。网站上价格是$78.99，但是我看太贵想离开页面的时候（点后退），跳出窗
: 口说给20%off，产品页面价格不变但是check out的时候就减掉了20%。
: 另外我很cheap的想，既然一片药可以管到100磅，而贪狗不到60磅，那么是不是可以把
: 每片药切掉1/3，这样就可以两片药吃三个月了？？可行么？

E*e2013-11-17 08:11

10 楼

要是能看看同样的任务在AMD+OpenCL和NV+CUDA上的表现就好了

【在 S******n 的大作中提到】

: 算Monte Carlo还是AMD的卡好。
: CUDA对AMD的唯一优势就是定义了一堆科学计算的函数。
: 只要不涉及复杂的包含函数的科学计算，一般都是AMD的显卡快。特别是像金融计算、
: 密码学计算。

w*r2013-11-17 08:11

11 楼

thanks. :)

x*u2013-11-17 08:11

12 楼

是不是可以把每片药切掉1/3，这样就可以两片药吃三个月了？？可行么？---------
dont do that. the active ingredients dont mix well in the pills. u can feed
mutiple pills at once, but cut one pill to several pieces r big no no

【在 c*****a 的大作中提到】

z*i2013-11-17 08:11

13 楼

不如比微软的direct computing, AMD和NV就各显神通了。
NV也有OpenCL啊，NV的OpenCL最终也是靠CUDA执行的，CUDA层次更低。
你这个问法，其实就像在问：不同CPU上，一个使用汇编语言，一个使用Basic语言，
那个性能好。这个比法本来就有些不公平啊。

【在 E***e 的大作中提到】

: 要是能看看同样的任务在AMD+OpenCL和NV+CUDA上的表现就好了

x*u2013-11-17 08:11

14 楼

interceptor kills one more worms than heartgurd

【在 m***j 的大作中提到】

: 这妈当的！
: HEARTGUARD是不是和INTERCEPTOR一样？

a*s2013-11-17 08:11

15 楼

像他这种问法，还那么狂，有意义么，太自以为是了
这里本来就是硬件论坛，不是科学计算的论坛，
而且，大家都可以有发表自己意见的权利
刚才我叫他自宫，他还真自宫了
然后，再起这个帖子，还在里面说什么”犯贱“
真不知道，这家伙怎么想的
你再自宫啊

【在 z******i 的大作中提到】

: 不如比微软的direct computing, AMD和NV就各显神通了。
: NV也有OpenCL啊，NV的OpenCL最终也是靠CUDA执行的，CUDA层次更低。
: 你这个问法，其实就像在问：不同CPU上，一个使用汇编语言，一个使用Basic语言，
: 那个性能好。这个比法本来就有些不公平啊。

m*h2013-11-17 08:11

16 楼

打成粉末

feed

【在 x********u 的大作中提到】

: 是不是可以把每片药切掉1/3，这样就可以两片药吃三个月了？？可行么？---------
: dont do that. the active ingredients dont mix well in the pills. u can feed
: mutiple pills at once, but cut one pill to several pieces r big no no

E*e2013-11-17 08:11

17 楼

我只是从计算角度出发，不是从硬件角度出发
你用OpenCL在NV的GPU上跑计算
隔着一层转换
明显不是最高的效率
像一楼这样的比较根本没比头
从计算的角度，要比就要比同样的simulation
AMD在OpenCL上编
NV在CUDA上编
然后两个拼速度
这才有意义

【在 z******i 的大作中提到】

m*j2013-11-17 08:11

18 楼

那贪狗妈也可以考虑INTERCEPTOR呀
INTERCEPTOR好象便宜些。我在VET直接买的，6个月也好象才40块
网上应该更便宜了

【在 x********u 的大作中提到】

: interceptor kills one more worms than heartgurd

z*i2013-11-17 08:11

19 楼

http://vga.zol.com.cn/410/4108339.html
http://vga.zol.com.cn/410/4108340.html
http://vga.zol.com.cn/410/4108341.html
http://vga.zol.com.cn/410/4108342.html

【在 E***e 的大作中提到】

: 我只是从计算角度出发，不是从硬件角度出发
: 你用OpenCL在NV的GPU上跑计算
: 隔着一层转换
: 明显不是最高的效率
: 像一楼这样的比较根本没比头
: 从计算的角度，要比就要比同样的simulation
: AMD在OpenCL上编
: NV在CUDA上编
: 然后两个拼速度
: 这才有意义

b*n2013-11-17 08:11

20 楼

我用的INTERCEPTOR，帮饭是35lb，我的vet说可以给她半片50-100lb的，而且
INTERCEPTOR的warranty也cover这种吃法，所以她同意把给饭的处方改成50-100lb的，
每年一个6个月装的了。

E*e2013-11-17 08:11

21 楼

可是依然没有互相独立线程计算的暴力重复啊
CFD和其他用于图形的矩阵运算其实还不是monte carlo那么简单粗暴的

【在 z******i 的大作中提到】

: http://vga.zol.com.cn/410/4108339.html
: http://vga.zol.com.cn/410/4108340.html
: http://vga.zol.com.cn/410/4108341.html
: http://vga.zol.com.cn/410/4108342.html

x*u2013-11-17 08:11

22 楼

ah? both of my vets said i could not split pills. i saw it online also.

【在 b*****n 的大作中提到】

: 我用的INTERCEPTOR，帮饭是35lb，我的vet说可以给她半片50-100lb的，而且
: INTERCEPTOR的warranty也cover这种吃法，所以她同意把给饭的处方改成50-100lb的，
: 每年一个6个月装的了。

a*e2013-11-17 08:11

23 楼

NV从opencl到CUDA会出现2X的性能损失不？

【在 E***e 的大作中提到】

b*n2013-11-17 08:11

24 楼

我的vet当时专门跑开了一会帮我去查了她收藏的说明书啊

【在 x********u 的大作中提到】

: ah? both of my vets said i could not split pills. i saw it online also.

E*e2013-11-17 08:11

25 楼

这就是我最好奇的问题
看了一圈下来没人说这件事
然后tomshardware拼命的在OpenCL上拼硬件
越来越有一种AMD写手的感觉

【在 a***e 的大作中提到】

: NV从opencl到CUDA会出现2X的性能损失不？

b*n2013-11-17 08:11

26 楼

我还想起来一件事。饭山刚来我家时，都是小个头，那时候vet给开的INTERCEPTOR就是
成年的体重的药片。比如给山开的就是50-100lb的，跟我说在他50lb之前每个月吃半片
。

a*e2013-11-17 08:11

27 楼

很难想象会出现2X
Nv的OpenCL又不是什么新手
CUDA这种独门独户的东西，学校里用用，搞搞科研，上几个免费PHD靠谱
说实话，你要是软件公司的，除非NV给钱
否则你愿意搞个东西除了NV上能跑其他都不能跑的
写OpenCL的，至少都跑起来了，就算在NV效率差点，
也比CUDA在AMD和其他的完全起不来靠谱
你要的这种数据，其实应该看NV的market文档
要是丫自己都不敢吹，真的就别抱太大希望

【在 E***e 的大作中提到】

: 这就是我最好奇的问题
: 看了一圈下来没人说这件事
: 然后tomshardware拼命的在OpenCL上拼硬件
: 越来越有一种AMD写手的感觉

l*o2013-11-17 08:11

28 楼

555, 我在网上直接买也要40块

【在 m***j 的大作中提到】

: 那贪狗妈也可以考虑INTERCEPTOR呀
: INTERCEPTOR好象便宜些。我在VET直接买的，6个月也好象才40块
: 网上应该更便宜了

E*e2013-11-17 08:11

29 楼

如果2X以内，那绝对AMD靠谱了
OpenCL唯一要解决的就是一些数学函数还没找到好的Library
回头试试ArrayFire
多谢了！

【在 a***e 的大作中提到】

: 很难想象会出现2X
: Nv的OpenCL又不是什么新手
: CUDA这种独门独户的东西，学校里用用，搞搞科研，上几个免费PHD靠谱
: 说实话，你要是软件公司的，除非NV给钱
: 否则你愿意搞个东西除了NV上能跑其他都不能跑的
: 写OpenCL的，至少都跑起来了，就算在NV效率差点，
: 也比CUDA在AMD和其他的完全起不来靠谱
: 你要的这种数据，其实应该看NV的market文档
: 要是丫自己都不敢吹，真的就别抱太大希望

d*g2013-11-17 08:11

30 楼

还可以这样，第一次听说。

【在 b*****n 的大作中提到】

l*e2013-11-17 08:11

31 楼

titan不是号称有很强的科学计算能力吗，怎么比7970Ghz差这么多

j*e2013-11-17 08:11

32 楼

为什么呀

【在 l*****o 的大作中提到】

: 555, 我在网上直接买也要40块

p*r2013-11-17 08:11

33 楼

可以查一下folding ppd或者boinc显卡项目的performance，其中wuprop项目就是专门
统计硬件计算能力的
http://wuprop.boinc-af.org/results/delai.py

l*o2013-11-17 08:11

34 楼

因为我很不善于寻找便宜的网站...

【在 j*****e 的大作中提到】

: 为什么呀

E*e2013-11-17 08:11

35 楼

看不懂这网站是在干吗啊 T_T

【在 p**********r 的大作中提到】

: 可以查一下folding ppd或者boinc显卡项目的performance，其中wuprop项目就是专门
: 统计硬件计算能力的
: http://wuprop.boinc-af.org/results/delai.py

c*a2013-11-17 08:11

36 楼

haha
竟然还有跟我一样cheap的vet。。。真好

【在 b*****n 的大作中提到】

: 我还想起来一件事。饭山刚来我家时，都是小个头，那时候vet给开的INTERCEPTOR就是
: 成年的体重的药片。比如给山开的就是50-100lb的，跟我说在他50lb之前每个月吃半片
: 。

S*n2013-11-17 08:11

37 楼

因为titan有个开关，打开双精度开关，显卡频率下降，就是一计算卡。
而关闭双精度开关，显卡频率上升，就是一游戏卡。
自己决定。

【在 l*****e 的大作中提到】

: titan不是号称有很强的科学计算能力吗，怎么比7970Ghz差这么多

x*u2013-11-17 08:11

38 楼

不是说明书吧？说明书里面肯定没写。

【在 b*****n 的大作中提到】

: 我的vet当时专门跑开了一会帮我去查了她收藏的说明书啊

p*r2013-11-17 08:11

39 楼

boinc是伯克利大学搞的一个开放式分布式计算平台，志愿者帮科研单位利用pc空闲能
力做计算，我上面给的链接是其中一个特殊的项目，专门统计各种机器计算效率的；目
前支持显卡计算的分布式项目有不下十个，跟生物有关的n卡项目我只记得gpugrid，你
可以查查她们用哪种方法计算.
[email protected]是斯坦福一个生物教授搞的封闭式分布志愿计算平台，比boinc早了好几
年，是影响力和志愿者人数最多的分布式项目，单核cpu，多核cpu，a卡
n卡都支持；folding point per day是一个衡量显卡通用计算能力的比较直观的数据，
好多新卡评测里有这一项，网上统计数据比较多，又是做生物计算的，你可以重点查查
这是一个中文社区，没什么学术价值，你可以看看当科普了
http://www.equn.com/wiki
http://www.equn.com/forum/forum.php

【在 E***e 的大作中提到】

: 看不懂这网站是在干吗啊 T_T

b*n2013-11-17 08:11

40 楼

她当时跟我说她去查了收藏的说明书

【在 x********u 的大作中提到】

: 不是说明书吧？说明书里面肯定没写。

E*e2013-11-17 08:11

41 楼

多谢了！！！

【在 p**********r 的大作中提到】

: boinc是伯克利大学搞的一个开放式分布式计算平台，志愿者帮科研单位利用pc空闲能
: 力做计算，我上面给的链接是其中一个特殊的项目，专门统计各种机器计算效率的；目
: 前支持显卡计算的分布式项目有不下十个，跟生物有关的n卡项目我只记得gpugrid，你
: 可以查查她们用哪种方法计算.
: [email protected]是斯坦福一个生物教授搞的封闭式分布志愿计算平台，比boinc早了好几
: 年，是影响力和志愿者人数最多的分布式项目，单核cpu，多核cpu，a卡
: n卡都支持；folding point per day是一个衡量显卡通用计算能力的比较直观的数据，
: 好多新卡评测里有这一项，网上统计数据比较多，又是做生物计算的，你可以重点查查
: 这是一个中文社区，没什么学术价值，你可以看看当科普了
: http://www.equn.com/wiki

L*i2013-11-17 08:11

42 楼

真是疯了
我家可爱的SENTINAL, 6个月70多刀................

S*n2013-11-17 08:11

43 楼

最新的超级计算机排行榜公布之际，NVIDIA也趁机发布了号称有史以来性能最强的加速
器——Tesla K40 GPU。
Quadro K6000、GeForce GTX 780 Ti已经分别在图形工作站、桌面上用到了完整版的
GK110大核心，这次终于轮到高性能计算了。此前首批用上GK110核心的Tesla K20X只开
启了2688个流处理器，今天的Tesla K40则开满了全部2880个，而且用的是B1步进的新
核心。
不仅如此，Tesla K40的频率更高了，核心从732MHz提升到745MHz，并支持动态加速，
且有810MHz、875MHz两个档次，浮点性能因此增至单精度4.29TFlops、双精度1.
43TFlops(3:1)。
而显存不但频率从5.2GHz提升至6GHz，容量也翻一番、在该系列中首次达到了惊人的
12GB，为此使用了刚刚量产不久的4Gb(512MB) GDDR5显存颗粒，因此依旧是24颗。配合
384-bit的位宽，带宽也来到了288GB/s。
更令人印象深刻的是，Tesla K40的热设计功耗依然保持在235W。

j*e2013-11-17 08:11

44 楼

你那个vet太黑了点吧

【在 c*****a 的大作中提到】

E*e2013-11-17 08:11

45 楼

nv家的flops水分很大啊。。。

【在 S******n 的大作中提到】

: 最新的超级计算机排行榜公布之际，NVIDIA也趁机发布了号称有史以来性能最强的加速
: 器——Tesla K40 GPU。
: Quadro K6000、GeForce GTX 780 Ti已经分别在图形工作站、桌面上用到了完整版的
: GK110大核心，这次终于轮到高性能计算了。此前首批用上GK110核心的Tesla K20X只开
: 启了2688个流处理器，今天的Tesla K40则开满了全部2880个，而且用的是B1步进的新
: 核心。
: 不仅如此，Tesla K40的频率更高了，核心从732MHz提升到745MHz，并支持动态加速，
: 且有810MHz、875MHz两个档次，浮点性能因此增至单精度4.29TFlops、双精度1.
: 43TFlops(3:1)。
: 而显存不但频率从5.2GHz提升至6GHz，容量也翻一番、在该系列中首次达到了惊人的

S*n2013-11-17 08:11

46 楼

怎么水分了？这张卡要$5500, 要是还差，就太对不住这价钱了。
跟Telsa K20X的对比：

【在 E***e 的大作中提到】

: nv家的flops水分很大啊。。。

S*n2013-11-17 08:11

47 楼

NVIDIA今天（11-19-2013）宣布了另外一条重要消息：已经与蓝色巨人IBM达成了广泛
的合作协议，将共同推进超级计算机技术的前进，IBM的软硬件都将支持NVIDIA GPU加
速。
首先在软件方面，IBM的各种企业级软件，包括、商业智能、预测分析、风险分析等等(
比如InfoSphere)，都将会引入CUDA GPU加速。
数据分析虽然一般不属于超级计算项目，但也需要强大的计算能力做支撑，这显然给
Tesla留下了充足的空间。

E*e2013-11-17 08:11

48 楼

那titan跑monte carlo比amd落后那么多
是因为amd专长monte carlo？

【在 S******n 的大作中提到】

: 怎么水分了？这张卡要$5500, 要是还差，就太对不住这价钱了。
: 跟Telsa K20X的对比：

S*n2013-11-17 08:11

49 楼

你贴的那个图应该是7990写错写成7970了。
正确的图是
7990是两块7970，所以大幅度领先Titan。
7970GE的monte carlo单精度下领先Titan 30%，双精度下领先Titan 20%——AMD的确专
长monte carlo。

【在 E***e 的大作中提到】

: 那titan跑monte carlo比amd落后那么多
: 是因为amd专长monte carlo？

E*e2013-11-17 08:11

50 楼

谢谢谢谢谢谢谢谢！

【在 S******n 的大作中提到】

: 你贴的那个图应该是7990写错写成7970了。
: 正确的图是
: 7990是两块7970，所以大幅度领先Titan。
: 7970GE的monte carlo单精度下领先Titan 30%，双精度下领先Titan 20%——AMD的确专
: 长monte carlo。