Redian新闻
>
请问有没有Nvidia GPU在CUDA上计算的benchmark
avatar
请问有没有Nvidia GPU在CUDA上计算的benchmark# Hardware - 计算机硬件
w*r
1
请大家帮忙提供一个最近的移民所要打的疫苗名字。想在中国办个证明,看看哪个已经
打过,就不用打了。 需要给>18岁的成人那个。 多谢了。
avatar
c*a
3
好久没灌水了,大家还好么?
上个月底因为贪狗拉肚子去了兽医那里。被狠狠宰了350刀,啥也没查出来,给的药也
没啥用,就不一一赘述了。反正趁机会查了下heart worm,没查出来,刚好可以上药了
。兽医给开了heartgard,$57,6个月的包装,一年要$114。我怒了,说没钱了,我网上
买到时候你给网上商店fax处方就好了。
昨天看了一圈儿之后在petcareRx买的。51-100磅,12个月的包装,$63.19,没税没
shipping。网站上价格是$78.99,但是我看太贵想离开页面的时候(点后退),跳出窗
口说给20%off,产品页面价格不变但是check out的时候就减掉了20%。
另外我很cheap的想,既然一片药可以管到100磅,而贪狗不到60磅,那么是不是可以把
每片药切掉1/3,这样就可以两片药吃三个月了??可行么?
avatar
E*e
4
具体到Monte Carlo的最好
类似这样的
找到的benchmark全都是在OpenCL上跑NV,明显不太公平
所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark
问题问到再具体不过了,请那些不懂的不要进来犯贱扯什么CPU,优化,挖矿,dense
matrix, hyper之类不着边的东西。
我就是问NV GPU在CUDA上的benchmark,最好是Monte Carlo,谢谢!
avatar
i*u
5
下载一个i-693表格就知道了吧,加上看皮匠的博客
avatar
m*j
6
这妈当的!
HEARTGUARD是不是和INTERCEPTOR一样?
avatar
S*n
7
算Monte Carlo还是AMD的卡好。
CUDA对AMD的唯一优势就是定义了一堆科学计算的函数。
只要不涉及复杂的包含函数的科学计算,一般都是AMD的显卡快。特别是像金融计算、
密码学计算。

【在 E***e 的大作中提到】
: 具体到Monte Carlo的最好
: 类似这样的
: 找到的benchmark全都是在OpenCL上跑NV,明显不太公平
: 所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark
: 问题问到再具体不过了,请那些不懂的不要进来犯贱扯什么CPU,优化,挖矿,dense
: matrix, hyper之类不着边的东西。
: 我就是问NV GPU在CUDA上的benchmark,最好是Monte Carlo,谢谢!

avatar
h*r
8
我的医生要求打:
MMR(要求两针,我以前打过一针,所以又打一针)
水痘(要求两针,我以前得过,所以不用打)
破伤风(??记不清料,以前打过,所以没打)

【在 w********r 的大作中提到】
: 请大家帮忙提供一个最近的移民所要打的疫苗名字。想在中国办个证明,看看哪个已经
: 打过,就不用打了。 需要给>18岁的成人那个。 多谢了。

avatar
m*h
9
南加没必要

【在 c*****a 的大作中提到】
: 好久没灌水了,大家还好么?
: 上个月底因为贪狗拉肚子去了兽医那里。被狠狠宰了350刀,啥也没查出来,给的药也
: 没啥用,就不一一赘述了。反正趁机会查了下heart worm,没查出来,刚好可以上药了
: 。兽医给开了heartgard,$57,6个月的包装,一年要$114。我怒了,说没钱了,我网上
: 买到时候你给网上商店fax处方就好了。
: 昨天看了一圈儿之后在petcareRx买的。51-100磅,12个月的包装,$63.19,没税没
: shipping。网站上价格是$78.99,但是我看太贵想离开页面的时候(点后退),跳出窗
: 口说给20%off,产品页面价格不变但是check out的时候就减掉了20%。
: 另外我很cheap的想,既然一片药可以管到100磅,而贪狗不到60磅,那么是不是可以把
: 每片药切掉1/3,这样就可以两片药吃三个月了??可行么?

avatar
E*e
10
要是能看看同样的任务在AMD+OpenCL和NV+CUDA上的表现就好了

【在 S******n 的大作中提到】
: 算Monte Carlo还是AMD的卡好。
: CUDA对AMD的唯一优势就是定义了一堆科学计算的函数。
: 只要不涉及复杂的包含函数的科学计算,一般都是AMD的显卡快。特别是像金融计算、
: 密码学计算。

avatar
w*r
11
thanks. :)
avatar
x*u
12
是不是可以把每片药切掉1/3,这样就可以两片药吃三个月了??可行么?---------
dont do that. the active ingredients dont mix well in the pills. u can feed
mutiple pills at once, but cut one pill to several pieces r big no no

【在 c*****a 的大作中提到】
: 好久没灌水了,大家还好么?
: 上个月底因为贪狗拉肚子去了兽医那里。被狠狠宰了350刀,啥也没查出来,给的药也
: 没啥用,就不一一赘述了。反正趁机会查了下heart worm,没查出来,刚好可以上药了
: 。兽医给开了heartgard,$57,6个月的包装,一年要$114。我怒了,说没钱了,我网上
: 买到时候你给网上商店fax处方就好了。
: 昨天看了一圈儿之后在petcareRx买的。51-100磅,12个月的包装,$63.19,没税没
: shipping。网站上价格是$78.99,但是我看太贵想离开页面的时候(点后退),跳出窗
: 口说给20%off,产品页面价格不变但是check out的时候就减掉了20%。
: 另外我很cheap的想,既然一片药可以管到100磅,而贪狗不到60磅,那么是不是可以把
: 每片药切掉1/3,这样就可以两片药吃三个月了??可行么?

avatar
z*i
13
不如比微软的direct computing, AMD和NV就各显神通了。
NV也有OpenCL啊,NV的OpenCL最终也是靠CUDA执行的,CUDA层次更低。
你这个问法,其实就像在问: 不同CPU上,一个使用汇编语言,一个使用Basic语言,
那个性能好。这个比法本来就有些不公平啊。

【在 E***e 的大作中提到】
: 要是能看看同样的任务在AMD+OpenCL和NV+CUDA上的表现就好了
avatar
x*u
14
interceptor kills one more worms than heartgurd

【在 m***j 的大作中提到】
: 这妈当的!
: HEARTGUARD是不是和INTERCEPTOR一样?

avatar
a*s
15
像他这种问法,还那么狂,有意义么,太自以为是了
这里本来就是硬件论坛,不是科学计算的论坛,
而且,大家都可以有发表自己意见的权利
刚才我叫他自宫,他还真自宫了
然后,再起这个帖子,还在里面说什么”犯贱“
真不知道,这家伙怎么想的
你再自宫啊

【在 z******i 的大作中提到】
: 不如比微软的direct computing, AMD和NV就各显神通了。
: NV也有OpenCL啊,NV的OpenCL最终也是靠CUDA执行的,CUDA层次更低。
: 你这个问法,其实就像在问: 不同CPU上,一个使用汇编语言,一个使用Basic语言,
: 那个性能好。这个比法本来就有些不公平啊。

avatar
m*h
16
打成粉末

feed

【在 x********u 的大作中提到】
: 是不是可以把每片药切掉1/3,这样就可以两片药吃三个月了??可行么?---------
: dont do that. the active ingredients dont mix well in the pills. u can feed
: mutiple pills at once, but cut one pill to several pieces r big no no

avatar
E*e
17
我只是从计算角度出发,不是从硬件角度出发
你用OpenCL在NV的GPU上跑计算
隔着一层转换
明显不是最高的效率
像一楼这样的比较根本没比头
从计算的角度,要比就要比同样的simulation
AMD在OpenCL上编
NV在CUDA上编
然后两个拼速度
这才有意义

【在 z******i 的大作中提到】
: 不如比微软的direct computing, AMD和NV就各显神通了。
: NV也有OpenCL啊,NV的OpenCL最终也是靠CUDA执行的,CUDA层次更低。
: 你这个问法,其实就像在问: 不同CPU上,一个使用汇编语言,一个使用Basic语言,
: 那个性能好。这个比法本来就有些不公平啊。

avatar
m*j
18
那贪狗妈也可以考虑INTERCEPTOR呀
INTERCEPTOR好象便宜些。我在VET直接买的,6个月也好象才40块
网上应该更便宜了

【在 x********u 的大作中提到】
: interceptor kills one more worms than heartgurd
avatar
z*i
19
http://vga.zol.com.cn/410/4108339.html
http://vga.zol.com.cn/410/4108340.html
http://vga.zol.com.cn/410/4108341.html
http://vga.zol.com.cn/410/4108342.html

【在 E***e 的大作中提到】
: 我只是从计算角度出发,不是从硬件角度出发
: 你用OpenCL在NV的GPU上跑计算
: 隔着一层转换
: 明显不是最高的效率
: 像一楼这样的比较根本没比头
: 从计算的角度,要比就要比同样的simulation
: AMD在OpenCL上编
: NV在CUDA上编
: 然后两个拼速度
: 这才有意义

avatar
b*n
20
我用的INTERCEPTOR,帮饭是35lb,我的vet说可以给她半片50-100lb的,而且
INTERCEPTOR的warranty也cover这种吃法,所以她同意把给饭的处方改成50-100lb的,
每年一个6个月装的了。
avatar
x*u
22
ah? both of my vets said i could not split pills. i saw it online also.

【在 b*****n 的大作中提到】
: 我用的INTERCEPTOR,帮饭是35lb,我的vet说可以给她半片50-100lb的,而且
: INTERCEPTOR的warranty也cover这种吃法,所以她同意把给饭的处方改成50-100lb的,
: 每年一个6个月装的了。

avatar
a*e
23
NV从opencl到CUDA会出现2X的性能损失不?

【在 E***e 的大作中提到】
: 具体到Monte Carlo的最好
: 类似这样的
: 找到的benchmark全都是在OpenCL上跑NV,明显不太公平
: 所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark
: 问题问到再具体不过了,请那些不懂的不要进来犯贱扯什么CPU,优化,挖矿,dense
: matrix, hyper之类不着边的东西。
: 我就是问NV GPU在CUDA上的benchmark,最好是Monte Carlo,谢谢!

avatar
b*n
24
我的vet当时专门跑开了一会帮我去查了她收藏的说明书啊

【在 x********u 的大作中提到】
: ah? both of my vets said i could not split pills. i saw it online also.
avatar
E*e
25
这就是我最好奇的问题
看了一圈下来没人说这件事
然后tomshardware拼命的在OpenCL上拼硬件
越来越有一种AMD写手的感觉

【在 a***e 的大作中提到】
: NV从opencl到CUDA会出现2X的性能损失不?
avatar
b*n
26
我还想起来一件事。饭山刚来我家时,都是小个头,那时候vet给开的INTERCEPTOR就是
成年的体重的药片。比如给山开的就是50-100lb的,跟我说在他50lb之前每个月吃半片
avatar
a*e
27
很难想象会出现2X
Nv的OpenCL又不是什么新手
CUDA这种独门独户的东西,学校里用用,搞搞科研,上几个免费PHD靠谱
说实话,你要是软件公司的,除非NV给钱
否则你愿意搞个东西除了NV上能跑其他都不能跑的
写OpenCL的,至少都跑起来了,就算在NV效率差点,
也比CUDA在AMD和其他的完全起不来靠谱
你要的这种数据,其实应该看NV的market文档
要是丫自己都不敢吹,真的就别抱太大希望

【在 E***e 的大作中提到】
: 这就是我最好奇的问题
: 看了一圈下来没人说这件事
: 然后tomshardware拼命的在OpenCL上拼硬件
: 越来越有一种AMD写手的感觉

avatar
l*o
28
555, 我在网上直接买也要40块

【在 m***j 的大作中提到】
: 那贪狗妈也可以考虑INTERCEPTOR呀
: INTERCEPTOR好象便宜些。我在VET直接买的,6个月也好象才40块
: 网上应该更便宜了

avatar
E*e
29
如果2X以内,那绝对AMD靠谱了
OpenCL唯一要解决的就是一些数学函数还没找到好的Library
回头试试ArrayFire
多谢了!

【在 a***e 的大作中提到】
: 很难想象会出现2X
: Nv的OpenCL又不是什么新手
: CUDA这种独门独户的东西,学校里用用,搞搞科研,上几个免费PHD靠谱
: 说实话,你要是软件公司的,除非NV给钱
: 否则你愿意搞个东西除了NV上能跑其他都不能跑的
: 写OpenCL的,至少都跑起来了,就算在NV效率差点,
: 也比CUDA在AMD和其他的完全起不来靠谱
: 你要的这种数据,其实应该看NV的market文档
: 要是丫自己都不敢吹,真的就别抱太大希望

avatar
d*g
30
还可以这样,第一次听说。

【在 b*****n 的大作中提到】
: 我用的INTERCEPTOR,帮饭是35lb,我的vet说可以给她半片50-100lb的,而且
: INTERCEPTOR的warranty也cover这种吃法,所以她同意把给饭的处方改成50-100lb的,
: 每年一个6个月装的了。

avatar
l*e
31
titan不是号称有很强的科学计算能力吗,怎么比7970Ghz差这么多
avatar
j*e
32
为什么呀

【在 l*****o 的大作中提到】
: 555, 我在网上直接买也要40块
avatar
l*o
34
因为我很不善于寻找便宜的网站...

【在 j*****e 的大作中提到】
: 为什么呀
avatar
E*e
35
看不懂这网站是在干吗啊 T_T

【在 p**********r 的大作中提到】
: 可以查一下folding ppd或者boinc显卡项目的performance,其中wuprop项目就是专门
: 统计硬件计算能力的
: http://wuprop.boinc-af.org/results/delai.py

avatar
c*a
36
haha
竟然还有跟我一样cheap的vet。。。真好

【在 b*****n 的大作中提到】
: 我还想起来一件事。饭山刚来我家时,都是小个头,那时候vet给开的INTERCEPTOR就是
: 成年的体重的药片。比如给山开的就是50-100lb的,跟我说在他50lb之前每个月吃半片
: 。

avatar
S*n
37
因为titan有个开关,打开双精度开关,显卡频率下降,就是一计算卡。
而关闭双精度开关,显卡频率上升,就是一游戏卡。
自己决定。

【在 l*****e 的大作中提到】
: titan不是号称有很强的科学计算能力吗,怎么比7970Ghz差这么多
avatar
x*u
38
不是说明书吧?说明书里面肯定没写。

【在 b*****n 的大作中提到】
: 我的vet当时专门跑开了一会帮我去查了她收藏的说明书啊
avatar
p*r
39
boinc是伯克利大学搞的一个开放式分布式计算平台,志愿者帮科研单位利用pc空闲能
力做计算,我上面给的链接是其中一个特殊的项目,专门统计各种机器计算效率的;目
前支持显卡计算的分布式项目有不下十个,跟生物有关的n卡项目我只记得gpugrid,你
可以查查她们用哪种方法计算.
[email protected]是斯坦福一个生物教授搞的封闭式分布志愿计算平台,比boinc早了好几
年,是影响力和志愿者人数最多的分布式项目,单核cpu,多核cpu,a卡
n卡都支持;folding point per day是一个衡量显卡通用计算能力的比较直观的数据,
好多新卡评测里有这一项,网上统计数据比较多,又是做生物计算的,你可以重点查查
这是一个中文社区,没什么学术价值,你可以看看当科普了
http://www.equn.com/wiki
http://www.equn.com/forum/forum.php

【在 E***e 的大作中提到】
: 看不懂这网站是在干吗啊 T_T
avatar
b*n
40
她当时跟我说她去查了收藏的说明书

【在 x********u 的大作中提到】
: 不是说明书吧?说明书里面肯定没写。
avatar
E*e
41
多谢了!!!

【在 p**********r 的大作中提到】
: boinc是伯克利大学搞的一个开放式分布式计算平台,志愿者帮科研单位利用pc空闲能
: 力做计算,我上面给的链接是其中一个特殊的项目,专门统计各种机器计算效率的;目
: 前支持显卡计算的分布式项目有不下十个,跟生物有关的n卡项目我只记得gpugrid,你
: 可以查查她们用哪种方法计算.
: [email protected]是斯坦福一个生物教授搞的封闭式分布志愿计算平台,比boinc早了好几
: 年,是影响力和志愿者人数最多的分布式项目,单核cpu,多核cpu,a卡
: n卡都支持;folding point per day是一个衡量显卡通用计算能力的比较直观的数据,
: 好多新卡评测里有这一项,网上统计数据比较多,又是做生物计算的,你可以重点查查
: 这是一个中文社区,没什么学术价值,你可以看看当科普了
: http://www.equn.com/wiki

avatar
L*i
42
真是疯了
我家可爱的SENTINAL, 6个月70多刀................
avatar
S*n
43
最新的超级计算机排行榜公布之际,NVIDIA也趁机发布了号称有史以来性能最强的加速
器——Tesla K40 GPU。
Quadro K6000、GeForce GTX 780 Ti已经分别在图形工作站、桌面上用到了完整版的
GK110大核心,这次终于轮到高性能计算了。此前首批用上GK110核心的Tesla K20X只开
启了2688个流处理器,今天的Tesla K40则开满了全部2880个,而且用的是B1步进的新
核心。
不仅如此,Tesla K40的频率更高了,核心从732MHz提升到745MHz,并支持动态加速,
且有810MHz、875MHz两个档次,浮点性能因此增至单精度4.29TFlops、双精度1.
43TFlops(3:1)。
而显存不但频率从5.2GHz提升至6GHz,容量也翻一番、在该系列中首次达到了惊人的
12GB,为此使用了刚刚量产不久的4Gb(512MB) GDDR5显存颗粒,因此依旧是24颗。配合
384-bit的位宽,带宽也来到了288GB/s。
更令人印象深刻的是,Tesla K40的热设计功耗依然保持在235W。
avatar
j*e
44
你那个vet太黑了点吧

【在 c*****a 的大作中提到】
: 好久没灌水了,大家还好么?
: 上个月底因为贪狗拉肚子去了兽医那里。被狠狠宰了350刀,啥也没查出来,给的药也
: 没啥用,就不一一赘述了。反正趁机会查了下heart worm,没查出来,刚好可以上药了
: 。兽医给开了heartgard,$57,6个月的包装,一年要$114。我怒了,说没钱了,我网上
: 买到时候你给网上商店fax处方就好了。
: 昨天看了一圈儿之后在petcareRx买的。51-100磅,12个月的包装,$63.19,没税没
: shipping。网站上价格是$78.99,但是我看太贵想离开页面的时候(点后退),跳出窗
: 口说给20%off,产品页面价格不变但是check out的时候就减掉了20%。
: 另外我很cheap的想,既然一片药可以管到100磅,而贪狗不到60磅,那么是不是可以把
: 每片药切掉1/3,这样就可以两片药吃三个月了??可行么?

avatar
E*e
45
nv家的flops水分很大啊。。。

【在 S******n 的大作中提到】
: 最新的超级计算机排行榜公布之际,NVIDIA也趁机发布了号称有史以来性能最强的加速
: 器——Tesla K40 GPU。
: Quadro K6000、GeForce GTX 780 Ti已经分别在图形工作站、桌面上用到了完整版的
: GK110大核心,这次终于轮到高性能计算了。此前首批用上GK110核心的Tesla K20X只开
: 启了2688个流处理器,今天的Tesla K40则开满了全部2880个,而且用的是B1步进的新
: 核心。
: 不仅如此,Tesla K40的频率更高了,核心从732MHz提升到745MHz,并支持动态加速,
: 且有810MHz、875MHz两个档次,浮点性能因此增至单精度4.29TFlops、双精度1.
: 43TFlops(3:1)。
: 而显存不但频率从5.2GHz提升至6GHz,容量也翻一番、在该系列中首次达到了惊人的

avatar
S*n
46
怎么水分了?这张卡要$5500, 要是还差,就太对不住这价钱了。
跟Telsa K20X的对比:

【在 E***e 的大作中提到】
: nv家的flops水分很大啊。。。
avatar
S*n
47
NVIDIA今天(11-19-2013)宣布了另外一条重要消息:已经与蓝色巨人IBM达成了广泛
的合作协议,将共同推进超级计算机技术的前进,IBM的软硬件都将支持NVIDIA GPU加
速。
首先在软件方面,IBM的各种企业级软件,包括、商业智能、预测分析、风险分析等等(
比如InfoSphere),都将会引入CUDA GPU加速。
数据分析虽然一般不属于超级计算项目,但也需要强大的计算能力做支撑,这显然给
Tesla留下了充足的空间。
avatar
E*e
48
那titan跑monte carlo比amd落后那么多
是因为amd专长monte carlo?

【在 S******n 的大作中提到】
: 怎么水分了?这张卡要$5500, 要是还差,就太对不住这价钱了。
: 跟Telsa K20X的对比:

avatar
S*n
49
你贴的那个图应该是7990写错写成7970了。
正确的图是
7990是两块7970,所以大幅度领先Titan。
7970GE的monte carlo单精度下领先Titan 30%,双精度下领先Titan 20%——AMD的确专
长monte carlo。

【在 E***e 的大作中提到】
: 那titan跑monte carlo比amd落后那么多
: 是因为amd专长monte carlo?

avatar
E*e
50
谢谢谢谢谢谢谢谢!

【在 S******n 的大作中提到】
: 你贴的那个图应该是7990写错写成7970了。
: 正确的图是
: 7990是两块7970,所以大幅度领先Titan。
: 7970GE的monte carlo单精度下领先Titan 30%,双精度下领先Titan 20%——AMD的确专
: 长monte carlo。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。