Redian新闻
>
zz 故宫画猫名品集锦 (转载)
avatar
zz 故宫画猫名品集锦 (转载)# pets - 心有所宠
n*l
1
似乎看不到哪个版面更合适,就问问众位经验丰富的牛牛们吧。
现在我在做一个耗时间非常长的计算,用谱方法解微分方程,主要就是
重复的FFT。现在我用Matlab,在我的iMac上算一次要用好几个礼拜。
这要是增加一下规模的话,算一次就是好几个月了,受不了。而且学校
太烂,也没有像样的有足够内存的并行机可用。
据说c++要比Matlab快一点儿,但是我想问的是,按说Matlab的向量运
算和并行处理已经优化得很好了,反正是要调用一些已经优化好了的库函
数,C++真的会比Matlab强一点儿么?强在哪儿呢?
avatar
l*t
2
给我爸妈延期,我和我老公搞砸了,用了老的被关了账户的支票,支票被退,申请自然
就被拒绝了。通知上说不会重新启动被拒的case,必须要重新申请。但是重新申请还可
以吗,尤其是I94已经过期了?
我爸妈现在是不是只能立马离境?我们可以等20天再离境吗?
avatar
c*r
3
☆─────────────────────────────────────☆
willer (willer) 于 (Thu Jul 14 17:14:49 2011, 美东) 提到:
大家怎么开始和老板谈绿卡的sponsorship?
直接开口说我要绿卡支持么?还是旁敲暗示?
工作多久和老板谈的?
☆─────────────────────────────────────☆
yyjames (不回了不回了) 于 (Thu Jul 14 17:24:57 2011, 美东) 提到:
这个给offer的时候就要提。

☆─────────────────────────────────────☆
llabell (凉凉) 于 (Thu Jul 14 17:39:20 2011, 美东) 提到:
说到这个我有感慨阿。真是傻人有傻福。。。我当年不知道这个东西还算是公司给的小
恩小惠。刚工作办h1b的时候公司问我绿卡呢要办吗?我高傲的回答我还没想好要不要
呆在这儿。。。半年后某天直接写信给hr说finally我决定我要办绿卡了。hr马上屁颠
颠的帮我找律师。。。唉,当年的hr大姐真的是我见过最好的人之一,07大潮最后交材
料的时候发现少了张纸比我还急,我的材料是她亲手寄出去的,搞定后还给我发信道歉
说不好意思她刚才panic了。。。也就是我那时候小p孩傻了吧唧的也没好好感谢人家。
☆─────────────────────────────────────☆
EBTWOFEB2007 (EB2) 于 (Thu Jul 14 17:41:31 2011, 美东) 提到:
Very nice HR. After getting card you should personally thank her for this
big help.
avatar
d*u
4
这里。。 都付CASH吗
avatar
w*w
5
【 以下文字转载自 History 讨论区 】
发信人: pal (醒时诗酒醉时歌), 信区: History
标 题: zz 故宫画猫名品集锦
发信站: BBS 未名空间站 (Fri Jan 1 15:00:49 2010, 美东)
http://www.npm.gov.tw/da/ch-htm/prospect04-b-3.html
http://www.npm.gov.tw/da/ch-htm/prospect04-b-4.html
http://www.npm.gov.tw/da/ch-htm/prospect04-b-5.html
http://www.npm.gov.tw/da/ch-htm/prospect04-b-6.html
http://www.npm.gov.tw/da/ch-htm/prospect04-b-7.html
無論寫實、寫意,主角、配角,畫裏的小動物永遠是整幅畫中引人注目的焦點。
古人稱貓為「貍奴」,意思是養馴了以供使役的野貓。自古以來,貓兒們的工作內容,
除了廣為人知的當寵物和捉老鼠以外,有時候還偶爾客串畫家的模特兒,躍身為藝術創
作的主角。本
avatar
a*y
6
并行计算?are you sure 你使用了matlab的并行计算吗,这个可不是自动的,是需要
编程解决的,matlab的并行很呆瓜,但对于一些固定的计算也可以将就一下
大型的并行计算fft很成熟了吧,并行效率很高,这个据说是最快的,但是你得会用http://www.fftw.org/
avatar
o*c
7
希望你的父母顺利离境了,因为是在i94过期后离境的,下次来美国要重新申请签证
avatar
p*s
8
要直接谈,很坦诚地。讲自己喜欢美国,也希望能一直在公司干下去,希望能做美国的
永久居民,而对你来说,能获得绿卡的唯一途径就是要公司为你申请。恳请公司考虑你
的请求。如公司有人力,有人事政策,就会帮你的。
avatar
p*a
9
都用麻袋扛着钞票来买的。。。。
avatar
C*e
10
哈哈,画里的猫看起来都像神兽
avatar
l*n
11
matlab 最新的版本应该fft是自动多核运算的
不知道你说的并行运算是不是这个
matlab慢的是for loop
你做time domain pseudospectral method?
估计也是要用for loop吧
C应该会快至少2-3倍
但是你这个要算几个星期太夸张了
可以考虑加GPU
我试过可以再快7-8倍
avatar
l*t
12
已经回国一个月了,希望再次签证顺利。

【在 o****c 的大作中提到】
: 希望你的父母顺利离境了,因为是在i94过期后离境的,下次来美国要重新申请签证
avatar
t*s
13
好像old center用米袋的人比较多,阿三用咖哩袋扛着钞票
avatar
s*l
14
大家看过《贼猫》么?
里面提过《相猫经》,我还以为是作者杜撰
avatar
n*l
15
Matlab的FFT确实是自动并行多核运行,反正我的iMac的四个核是
基本全速运行。
我现在是在一个512x512的网格上用一个semi-implicit scheme
解一个parabolic equation, 时间步长是10^{-6}, 每步要几次FFT,
时间从0到七八十的样子就要算三个礼拜了。这里面用了个while
循环以及几个if判断,也许时间花在了while循环上?
我把网格变成1024x1024时,花费时间基本上是x4,所以时间似乎
是主要花费在FFT上。
我对于这样规模的问题,在四核iMac上到底应该花费多少时间没有什
么概念。已经多年没有进行严肃的计算了。至于GPU计算,受GPU内
存的限制,对于网格的大小限制也比较大。我看到有文章里说6GB内
存的GPU只能处理128x128x128的三维网格,那就是1024x1024的
二维网格呗?我还想尝试一下2048x2048甚至更大点的网格,GPU可
能有困难。

【在 l********n 的大作中提到】
: matlab 最新的版本应该fft是自动多核运算的
: 不知道你说的并行运算是不是这个
: matlab慢的是for loop
: 你做time domain pseudospectral method?
: 估计也是要用for loop吧
: C应该会快至少2-3倍
: 但是你这个要算几个星期太夸张了
: 可以考虑加GPU
: 我试过可以再快7-8倍

avatar
l*t
16
给我爸妈延期,我和我老公搞砸了,用了老的被关了账户的支票,支票被退,申请自然
就被拒绝了。通知上说不会重新启动被拒的case,必须要重新申请。但是重新申请还可
以吗,尤其是I94已经过期了?
我爸妈现在是不是只能立马离境?我们可以等20天再离境吗?
avatar
s*r
17
画的真生动啊

【在 w****w 的大作中提到】
: 【 以下文字转载自 History 讨论区 】
: 发信人: pal (醒时诗酒醉时歌), 信区: History
: 标 题: zz 故宫画猫名品集锦
: 发信站: BBS 未名空间站 (Fri Jan 1 15:00:49 2010, 美东)
: http://www.npm.gov.tw/da/ch-htm/prospect04-b-3.html
: http://www.npm.gov.tw/da/ch-htm/prospect04-b-4.html
: http://www.npm.gov.tw/da/ch-htm/prospect04-b-5.html
: http://www.npm.gov.tw/da/ch-htm/prospect04-b-6.html
: http://www.npm.gov.tw/da/ch-htm/prospect04-b-7.html
: 無論寫實、寫意,主角、配角,畫裏的小動物永遠是整幅畫中引人注目的焦點。

avatar
p*u
18
新版本的matlab(好像是2010以后)fft是自动多核的,如果你的瓶颈是fft用C写不会
快多少,可以用profiler看不同函数运行了多长时间和次数。用GPU能块,不过你所有
的东西都要在GPU上实现,不然在GPU内存和系统内存间互相倒数据也会很费时间,特别
是数据很大的时候。

【在 n*******l 的大作中提到】
: 似乎看不到哪个版面更合适,就问问众位经验丰富的牛牛们吧。
: 现在我在做一个耗时间非常长的计算,用谱方法解微分方程,主要就是
: 重复的FFT。现在我用Matlab,在我的iMac上算一次要用好几个礼拜。
: 这要是增加一下规模的话,算一次就是好几个月了,受不了。而且学校
: 太烂,也没有像样的有足够内存的并行机可用。
: 据说c++要比Matlab快一点儿,但是我想问的是,按说Matlab的向量运
: 算和并行处理已经优化得很好了,反正是要调用一些已经优化好了的库函
: 数,C++真的会比Matlab强一点儿么?强在哪儿呢?

avatar
o*c
19
希望你的父母顺利离境了,因为是在i94过期后离境的,下次来美国要重新申请签证
avatar
w*x
20
瞎说两句……
MATLAB如果用了大量LOOP会很慢,所以可以用C来优化(不一定C++,一般C就够了……
优化瓶颈即可)。
推荐些mex code来把有循环的函数重写一遍:
http://www.mathworks.com/help/matlab/ref/mex.html
当然,也可以用C先compile成dll然后调用。这个方法的好处是同样的C代码可以被别的
除了MATLAB以外的语言使用,比如PYTHON……
最后,推荐用profiling找一下瓶颈。

【在 n*******l 的大作中提到】
: 似乎看不到哪个版面更合适,就问问众位经验丰富的牛牛们吧。
: 现在我在做一个耗时间非常长的计算,用谱方法解微分方程,主要就是
: 重复的FFT。现在我用Matlab,在我的iMac上算一次要用好几个礼拜。
: 这要是增加一下规模的话,算一次就是好几个月了,受不了。而且学校
: 太烂,也没有像样的有足够内存的并行机可用。
: 据说c++要比Matlab快一点儿,但是我想问的是,按说Matlab的向量运
: 算和并行处理已经优化得很好了,反正是要调用一些已经优化好了的库函
: 数,C++真的会比Matlab强一点儿么?强在哪儿呢?

avatar
l*t
21
已经回国一个月了,希望再次签证顺利。

【在 o****c 的大作中提到】
: 希望你的父母顺利离境了,因为是在i94过期后离境的,下次来美国要重新申请签证
avatar
n*l
22
很有道理。多谢。
我刚刚用profile看了看,2/3的时间是fft和ifft。估计那些部分是没办法了,看看
其他部分能不能省点儿是点儿。
我的程序总共就一个400来行,一层循环,就是每个时间步长计算若干次FFT 和 IFFT,
让我看看能不能把IFFT省掉。

【在 w*x 的大作中提到】
: 瞎说两句……
: MATLAB如果用了大量LOOP会很慢,所以可以用C来优化(不一定C++,一般C就够了……
: 优化瓶颈即可)。
: 推荐些mex code来把有循环的函数重写一遍:
: http://www.mathworks.com/help/matlab/ref/mex.html
: 当然,也可以用C先compile成dll然后调用。这个方法的好处是同样的C代码可以被别的
: 除了MATLAB以外的语言使用,比如PYTHON……
: 最后,推荐用profiling找一下瓶颈。

avatar
l*t
23
update一下,我爸妈今天重新签证通过了!
avatar
T*u
24
matlab提供分析功能,你可以看看时间都花在哪里。
avatar
w*U
25
it could be better to use fortran or c to call fftw. this should be much
faster than matlab. fortran or c generates binary code whereas matlab runs
line by line and is pretty slow for doing loops.

【在 n*******l 的大作中提到】
: 似乎看不到哪个版面更合适,就问问众位经验丰富的牛牛们吧。
: 现在我在做一个耗时间非常长的计算,用谱方法解微分方程,主要就是
: 重复的FFT。现在我用Matlab,在我的iMac上算一次要用好几个礼拜。
: 这要是增加一下规模的话,算一次就是好几个月了,受不了。而且学校
: 太烂,也没有像样的有足够内存的并行机可用。
: 据说c++要比Matlab快一点儿,但是我想问的是,按说Matlab的向量运
: 算和并行处理已经优化得很好了,反正是要调用一些已经优化好了的库函
: 数,C++真的会比Matlab强一点儿么?强在哪儿呢?

avatar
j*o
26
没听说过严肃的计算数学问题用matlab搞的,不就是fft吗,又不是什么特殊的toolbox
,推翻用fortran或者c++重写吧,速度差了三到10倍,而且可以传到cluster上算,学
校里难道没有HPC?
avatar
n*l
27
其实我本来就是要画几张图,做个小电影什么的来支持我的分析结果的,然后就偷懒用
Matlab。看来还是逃不掉,改天把程序改成c++。

toolbox

【在 j***o 的大作中提到】
: 没听说过严肃的计算数学问题用matlab搞的,不就是fft吗,又不是什么特殊的toolbox
: ,推翻用fortran或者c++重写吧,速度差了三到10倍,而且可以传到cluster上算,学
: 校里难道没有HPC?

avatar
e*m
28
用Fortran吧,速度和Matlab不是一个级别的,虽然编的过程略痛苦。
Matlab的loop的计算效率简直是让人生不如死。
avatar
s*e
29
这年头随着PC速度提升,已经几乎没人用FORTRAN了吧。

【在 e****m 的大作中提到】
: 用Fortran吧,速度和Matlab不是一个级别的,虽然编的过程略痛苦。
: Matlab的loop的计算效率简直是让人生不如死。

avatar
w*U
30
many people are using fortran. in computational fluid dynamics community,
large-scale numerical computations are done with fortran. in many cases
fortran performs better than c and fortran has more libraries than c because
of history of numerical computation.

【在 s***e 的大作中提到】
: 这年头随着PC速度提升,已经几乎没人用FORTRAN了吧。
avatar
l*1
31
+1
our recent 5 Ys papers: F is flos and Matlab is leaf ..
3D movie simulation by it and ffmpeg

because

【在 w*******U 的大作中提到】
: many people are using fortran. in computational fluid dynamics community,
: large-scale numerical computations are done with fortran. in many cases
: fortran performs better than c and fortran has more libraries than c because
: of history of numerical computation.

avatar
l*1
32
Gnuplot?

【在 n*******l 的大作中提到】
: 其实我本来就是要画几张图,做个小电影什么的来支持我的分析结果的,然后就偷懒用
: Matlab。看来还是逃不掉,改天把程序改成c++。
:
: toolbox

avatar
n*l
33
网上有人说Matlab的FFT就是调用的fftw, 我用Profile仔细分析了一下我的
Matlab程序,它的FFT的性能是跟fftw一样的。
对于n=1024, 二维(nxn)的实数数据,12001次FFT 耗时141.538秒。
对于一维FFT,它的运算量是 5N log_2(N). 所以我的程序里的FFFT应该对应
N=2^_20,它的FLOPS是
5 * 2^20 *20*12001/141.538 = 8459 M FLOPS.
同时我的系统对复数进行了12000次IFFT,耗时222.933秒,对应的FLOPS是
5383 M FLOPS。
这基本就是fftw在四核系统里的benchmark值。
这个FFT/IFFT是我的程序的主要部分,耗时占总时间的63%, 所以就算把程
序用C, C++ 或者Fortran重写,也基本没有什么改善了,除非放到更多核的
并行系统上去。要是想要利用GPU,倒腾数据是一个耗时严重的问题,要仔细
考虑一下。

【在 l**********1 的大作中提到】
: +1
: our recent 5 Ys papers: F is flos and Matlab is leaf ..
: 3D movie simulation by it and ffmpeg
:
: because

avatar
c*u
34
换个算法。
我解过积分方程,时域的算法是local的,可以用非等分grid. Matlab 1分钟就能算到1
毫秒,精度到皮妙量级。蘋域FFT的算法是global 的,要用等分的grid. 我们用了640
个CPU, 两天才能算出同样结果。而且FFT 对round off errors非常敏感,还要用
infinity precision package 来算。

【在 n*******l 的大作中提到】
: 网上有人说Matlab的FFT就是调用的fftw, 我用Profile仔细分析了一下我的
: Matlab程序,它的FFT的性能是跟fftw一样的。
: 对于n=1024, 二维(nxn)的实数数据,12001次FFT 耗时141.538秒。
: 对于一维FFT,它的运算量是 5N log_2(N). 所以我的程序里的FFFT应该对应
: N=2^_20,它的FLOPS是
: 5 * 2^20 *20*12001/141.538 = 8459 M FLOPS.
: 同时我的系统对复数进行了12000次IFFT,耗时222.933秒,对应的FLOPS是
: 5383 M FLOPS。
: 这基本就是fftw在四核系统里的benchmark值。
: 这个FFT/IFFT是我的程序的主要部分,耗时占总时间的63%, 所以就算把程

avatar
l*1
35
Sre, smartgrid should ask stoppingtime general..

到1
640

【在 c****u 的大作中提到】
: 换个算法。
: 我解过积分方程,时域的算法是local的,可以用非等分grid. Matlab 1分钟就能算到1
: 毫秒,精度到皮妙量级。蘋域FFT的算法是global 的,要用等分的grid. 我们用了640
: 个CPU, 两天才能算出同样结果。而且FFT 对round off errors非常敏感,还要用
: infinity precision package 来算。

avatar
c*h
36
想要数量级上的速度提升,申请一个computing cluster的帐号是正道
不过fft其实不是特别scabable,因为communication开销太大,
所以你还得找一个网络特别快的cluster
换个数值算法是根本解决方法。。。要么就心安理得不要算那么大的n

【在 n*******l 的大作中提到】
: 网上有人说Matlab的FFT就是调用的fftw, 我用Profile仔细分析了一下我的
: Matlab程序,它的FFT的性能是跟fftw一样的。
: 对于n=1024, 二维(nxn)的实数数据,12001次FFT 耗时141.538秒。
: 对于一维FFT,它的运算量是 5N log_2(N). 所以我的程序里的FFFT应该对应
: N=2^_20,它的FLOPS是
: 5 * 2^20 *20*12001/141.538 = 8459 M FLOPS.
: 同时我的系统对复数进行了12000次IFFT,耗时222.933秒,对应的FLOPS是
: 5383 M FLOPS。
: 这基本就是fftw在四核系统里的benchmark值。
: 这个FFT/IFFT是我的程序的主要部分,耗时占总时间的63%, 所以就算把程

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。