Redian新闻
>
+++++++求文 laser and photonics review, 不胜感激+++++++++
avatar
+++++++求文 laser and photonics review, 不胜感激+++++++++# Chemistry - 化学
S*s
1
【 以下文字转载自 NextGeneration 讨论区 】
发信人: Sweets (简简单单), 信区: NextGeneration
标 题: Sleep Train 6个多月宝宝遇到的问题
发信站: BBS 未名空间站 (Tue Mar 9 14:26:39 2010, 美东)
正在Sleep train六个多月的宝宝。
8点半-9点喂奶睡觉,基本不太哭了。
11点趁她迷迷糊糊抱起来喂一次奶,基本不醒。
4点左右会哼哼,然后继续睡到5点,这以后每隔十分钟哼哼一次,5点半起来给她喂奶5
盎司。
可是5点半喂奶这次宝宝就很清醒了,因为也大概睡了8个半小时。今天早上喂完奶再让
她自己睡回去,哭得特别伤心,折腾了快一个小时,7点才睡下,睡到快9点起来。
5点半这趟我该怎么处理呢?让她那个时候起床又太早了,白天外公外婆带不舍得让她
哭,每次也就睡15-30分钟就醒。喂完奶让她接着睡,断断续续哭一个小时又太舍不得
了。
求大家的建议~~
avatar
l*n
2
大喜大悲
现在又说什么明年都清不了大潮,那还有什么盼头?
今年人就是为了不浪费名额提前使用SO了,其实是负责任的举动,就是大家误判了,白高
兴了.
前面不是有人贴了,中国用自己的名额两年内也能把08的都给清了?
avatar
T*r
3
春假的时候回国一趟,看看父母亲友。另外一个目的带老大回国内看看,希望能让他长
长见识。小时候,我爸就是经常带我们兄弟俩出差,虽然圈子很小,基本上就是江浙沪
一带。这次时间比较紧迫,所以各个地方都是走马观花地看一遍。其实都是我以前去过
的地方,不过儿子没去过。
上海的早晨
老家的水库和新旧楼。关于这个水库,我从小到大一直就听到在里面淹死人的故事,却
从来没去过。这次去看了一眼,就是一个小池塘而已。旧楼是爸妈现在住的房子,旁边
的新楼已经快造好了,估计今明两年旧楼就会拆掉,拍张合影纪念一下。
苏州
周庄,本来是准备去乌镇的,不过在苏州老大吐了,就近去了周庄。据说差不了太多。
周庄、乌镇、西塘等等江南水乡小镇都很有特色,去哪一个都不错。唯一的问题是游人
太多,所要要拍照一定得工作日早晚去才行。
杭州,算是半个家乡了。带着老大在西湖边上晃了两天,看了看老西湖十景中的几个景
点和艺术相关的博物馆。
https://farm8.staticflickr.com/7774/17217776468_cd3ce99902_b.jpg
回到上海,去陆家嘴上了环球金融中心。
avatar
n*7
4
最近开始用java
之前没写过一个完整的java code
靠着神站堆栈溢出把几百行的R code改成了java
第一次跑居然只有一个dimension match的错误
静态语言配合IDE真强大
问题是java似乎没有好用的数学包
我需要一些矩阵操作,已经统计分析
找了好久,发现java的包
要么是多年没更新了(colt 11年)
要么是个个人项目,连文档都没有(UJMP)
要么功能很有限(大部分只支持一些矩阵操作,没有统计功能)
要么performance太差(https://code.google.com/p/java-matrix-benchmark/wiki/
RuntimeCorei7v2600_2013_10)
用了Apache common math
发现很烂,比如:
1.RealVector 没有算mean,count NaN这些基本需要的function
2.本来老早把数据转成RealVector了,用stat的时候发现还要转成double[]
3.stat的function连NaN remove的option都没有,最后都是手动处理
java有什么像样点的数学包吗?
BTW, java没有operator overloading是个比较烦心的事情,公式写出来太恶心了
avatar
a*l
6
5点半还好啦。加上马上要夏令时了,夏令时不就6点半了嘛。
索性玩玩到9点钟左右睡 the first nap 好了。

奶5

【在 S****s 的大作中提到】
: 【 以下文字转载自 NextGeneration 讨论区 】
: 发信人: Sweets (简简单单), 信区: NextGeneration
: 标 题: Sleep Train 6个多月宝宝遇到的问题
: 发信站: BBS 未名空间站 (Tue Mar 9 14:26:39 2010, 美东)
: 正在Sleep train六个多月的宝宝。
: 8点半-9点喂奶睡觉,基本不太哭了。
: 11点趁她迷迷糊糊抱起来喂一次奶,基本不醒。
: 4点左右会哼哼,然后继续睡到5点,这以后每隔十分钟哼哼一次,5点半起来给她喂奶5
: 盎司。
: 可是5点半喂奶这次宝宝就很清醒了,因为也大概睡了8个半小时。今天早上喂完奶再让

avatar
a*x
7
这,去年就说清不了了啊。

【在 l****n 的大作中提到】
: 大喜大悲
: 现在又说什么明年都清不了大潮,那还有什么盼头?
: 今年人就是为了不浪费名额提前使用SO了,其实是负责任的举动,就是大家误判了,白高
: 兴了.
: 前面不是有人贴了,中国用自己的名额两年内也能把08的都给清了?

avatar
y*b
8
T神好片儿啊
avatar
z*e
9
这个部分你还是多看看scala
无论是类库还是语言的features
scala就有operator overload了
avatar
x*y
11
很赞。几乎张张都喜欢。尤其是湖面枯枝和博物馆那两张。棒!

【在 T********r 的大作中提到】
: 春假的时候回国一趟,看看父母亲友。另外一个目的带老大回国内看看,希望能让他长
: 长见识。小时候,我爸就是经常带我们兄弟俩出差,虽然圈子很小,基本上就是江浙沪
: 一带。这次时间比较紧迫,所以各个地方都是走马观花地看一遍。其实都是我以前去过
: 的地方,不过儿子没去过。
: 上海的早晨
: 老家的水库和新旧楼。关于这个水库,我从小到大一直就听到在里面淹死人的故事,却
: 从来没去过。这次去看了一眼,就是一个小池塘而已。旧楼是爸妈现在住的房子,旁边
: 的新楼已经快造好了,估计今明两年旧楼就会拆掉,拍张合影纪念一下。
: 苏州
: 周庄,本来是准备去乌镇的,不过在苏州老大吐了,就近去了周庄。据说差不了太多。

avatar
n*7
12
作为jvm衍生语言
scala的库能比java的还好使?
我看大家都说scala复杂
作为1/3时间写代码的
不想太费脑力啊

【在 z****e 的大作中提到】
: 这个部分你还是多看看scala
: 无论是类库还是语言的features
: scala就有operator overload了

avatar
j*7
13
中国在你的照片里真的很美,拍的真好。
avatar
t*8
15
杭州的是保叔塔吗,好怀念啊
avatar
L*r
16
http://incanter.org/

【在 n******7 的大作中提到】
: 最近开始用java
: 之前没写过一个完整的java code
: 靠着神站堆栈溢出把几百行的R code改成了java
: 第一次跑居然只有一个dimension match的错误
: 静态语言配合IDE真强大
: 问题是java似乎没有好用的数学包
: 我需要一些矩阵操作,已经统计分析
: 找了好久,发现java的包
: 要么是多年没更新了(colt 11年)
: 要么是个个人项目,连文档都没有(UJMP)

avatar
P*u
17
同喜欢湖面枯枝和博物馆,
avatar
n*7
18
谢谢!
刚看了下目录,震惊了
第一章居然是C...
再看了下第8页,原来作者知道这一点
看来值得一读

【在 e*******o 的大作中提到】
: http://modelingwithdata.org/about_the_book.html
: 这本书你可能会喜欢。

avatar
v*w
19
同喜欢,照片拍得很棒!
avatar
n*7
20
这个我知道
其实几天前我写clojure比java还有经验些
用这个得再学clojure,短时间搞不定了
另外,也不知道这个包的质量如何
毕竟是个半个人项目
网站都做的乱死了
现在做math/statistics
MATLAB和R算一流工具
numpy/scipy算二流的
其他我试过的都是三流往下了...

【在 L*******r 的大作中提到】
: http://incanter.org/
avatar
E*1
21
中国风景区平均水平完胜美帝

【在 j*******7 的大作中提到】
: 中国在你的照片里真的很美,拍的真好。
avatar
n*7
22
这个书里的例子再次强调了R的慢
一般地,R比python/perl慢一个数量级
python/perl比C/java又慢一个数量级
我这次就是开始的算法在加上了几层东西之后,根本没法用了才被迫找R alternative
而且R core team很保守,稳定的优先级远大于performance
实在蛋疼

【在 n******7 的大作中提到】
: 谢谢!
: 刚看了下目录,震惊了
: 第一章居然是C...
: 再看了下第8页,原来作者知道这一点
: 看来值得一读

avatar
p*g
23
就接着P吧,颜色看上去就假
avatar
e*o
24
整本书就是c
r, python 都是调用c。返璞归真这叫。
这个作者还是挺牛x的,他把blog中c 的tips 整理了下,出了本书。
21st Century C: C Tips from the New School
我是怎么找到这个作者的呢? 我一个Raking的程序,不知道怎么就google 出来了。
好东西到处有。

【在 n******7 的大作中提到】
: 谢谢!
: 刚看了下目录,震惊了
: 第一章居然是C...
: 再看了下第8页,原来作者知道这一点
: 看来值得一读

avatar
x*i
25
Pretty
avatar
n*7
26
调用c跟写纯c还是很不一样的
performance也差别很大
这个作者的例子
R调用C写的lib跟纯C的code差了30倍运行时间
其实我的感觉是,R的计算量一旦上去了,运行时间跟计算量不是线性的
而是更快速率的增长,不知道为啥
很多写r python lib的都要把核心的部分写成c
其实这感觉很痛苦,还不如写java,一气呵成,速度在c的30%-100%级别,multiple
threading还容易

【在 e*******o 的大作中提到】
: 整本书就是c
: r, python 都是调用c。返璞归真这叫。
: 这个作者还是挺牛x的,他把blog中c 的tips 整理了下,出了本书。
: 21st Century C: C Tips from the New School
: 我是怎么找到这个作者的呢? 我一个Raking的程序,不知道怎么就google 出来了。
: 好东西到处有。

avatar
l*a
27
wow....上海和苏州的感觉都很好,乌镇啥的,你居然能碰到人少的时候~~~~
avatar
z*e
28
scala的eco主要是typesafe做
知道james gosling吧?
这个家伙从google离职后就跑去type sofe忽悠了
rod johnson就是那个做spring的也在typesafe
java历史上的几个英雄人物,除了lars bak,其他基本上都在折腾scala
其实从vert.x的建造来看,其他语言都比较容易搞
但是唯独scala,复杂度偏高,不太容易搞
不是说越复杂越好,但是scala说自己是better java,不是完全没有道理的
其他语言的eco达不到这个程度,牛人不多
本来数学的东西就比较复杂,涉及到优化
你想做好的类库,肯定要用到复杂的语言工具
自然scala比较得心应手

【在 n******7 的大作中提到】
: 作为jvm衍生语言
: scala的库能比java的还好使?
: 我看大家都说scala复杂
: 作为1/3时间写代码的
: 不想太费脑力啊

avatar
wh
29
是宝俶塔。
想问楼主博物馆是哪里,武林门的浙博分馆吗?

【在 t**********8 的大作中提到】
: 杭州的是保叔塔吗,好怀念啊
avatar
z*e
30

打好包就行了
你说的慢主要是并行上的优化处理
r什么都不管,一甩手掌柜,不管内存不管硬盘不管网络
自然慢,傻瓜是足够傻瓜了
关键是现在分布式的persistence主要是建立在hdfs这些基础之上
其实只要存储的这些定下来,很多优化都有办法做
关键是这些东西变来变去,导致经常要改,所以很多傻瓜化的工具就比较少
当然你要说简单容易,自然还是r这些容易
最理想的就是在hadoop eco上建r engine这些
但是目前这些东西都还只是一个概念或者prototype
没有十年左右的发展,估计没戏,当然也正是因为这块没啥东东
所以机会才多

【在 n******7 的大作中提到】
: 作为jvm衍生语言
: scala的库能比java的还好使?
: 我看大家都说scala复杂
: 作为1/3时间写代码的
: 不想太费脑力啊

avatar
T*r
31
是浙江美术馆的一个展厅。

【在 wh 的大作中提到】
: 是宝俶塔。
: 想问楼主博物馆是哪里,武林门的浙博分馆吗?

avatar
d*t
32
为毛用Java不用Python

【在 n******7 的大作中提到】
: 最近开始用java
: 之前没写过一个完整的java code
: 靠着神站堆栈溢出把几百行的R code改成了java
: 第一次跑居然只有一个dimension match的错误
: 静态语言配合IDE真强大
: 问题是java似乎没有好用的数学包
: 我需要一些矩阵操作,已经统计分析
: 找了好久,发现java的包
: 要么是多年没更新了(colt 11年)
: 要么是个个人项目,连文档都没有(UJMP)

avatar
N*Y
33
这种照片,从内容,色彩都很空洞。
希望楼主早些走出这种虚假的摄影爱好者审美
avatar
W*o
34
Java 根本就不是做数值计算的首选,杀鸡用牛刀明显不合适

【在 n******7 的大作中提到】
: 最近开始用java
: 之前没写过一个完整的java code
: 靠着神站堆栈溢出把几百行的R code改成了java
: 第一次跑居然只有一个dimension match的错误
: 静态语言配合IDE真强大
: 问题是java似乎没有好用的数学包
: 我需要一些矩阵操作,已经统计分析
: 找了好久,发现java的包
: 要么是多年没更新了(colt 11年)
: 要么是个个人项目,连文档都没有(UJMP)

avatar
T*r
35
麻烦请不吝赐教,指点指点什么样的是不空洞的吧?先谢过了!

【在 N**Y 的大作中提到】
: 这种照片,从内容,色彩都很空洞。
: 希望楼主早些走出这种虚假的摄影爱好者审美

avatar
d*i
36
你完全搞错了,Java和JVM根本不是用来做数值计算的,Java和PHP一样适合业务逻辑,
不适合scientific computation。搞科学计算就是matlab, python, R,当然其实都是C
啦。

【在 n******7 的大作中提到】
: 最近开始用java
: 之前没写过一个完整的java code
: 靠着神站堆栈溢出把几百行的R code改成了java
: 第一次跑居然只有一个dimension match的错误
: 静态语言配合IDE真强大
: 问题是java似乎没有好用的数学包
: 我需要一些矩阵操作,已经统计分析
: 找了好久,发现java的包
: 要么是多年没更新了(colt 11年)
: 要么是个个人项目,连文档都没有(UJMP)

avatar
N*Y
37
我说的直,见谅。
我在这些照片里只看到常见的浮华光影,色彩,构图。
看不到拍摄者的心,情绪,或与场景的互动关系。
这更像是欣赏,模仿大众“摄影“的美学受害者。
我也不知道如何说明白什么样的摄影不空洞,但是空洞如明信片般的摄影随处可见。
我去旅游的时候也有些这样类型的照片。没有你拍的好看。我不想把它们从相机里导出。
很多时候不空洞很难,但如果你暂时放开那些所谓的鲜艳色彩,平衡构图,美丽风景。
从平淡放松的角度诚实的拍出相机背后的自己, 也许你可以发现些不同。

【在 T********r 的大作中提到】
: 麻烦请不吝赐教,指点指点什么样的是不空洞的吧?先谢过了!
avatar
l*s
38
spark会是你的菜。

【在 n******7 的大作中提到】
: 最近开始用java
: 之前没写过一个完整的java code
: 靠着神站堆栈溢出把几百行的R code改成了java
: 第一次跑居然只有一个dimension match的错误
: 静态语言配合IDE真强大
: 问题是java似乎没有好用的数学包
: 我需要一些矩阵操作,已经统计分析
: 找了好久,发现java的包
: 要么是多年没更新了(colt 11年)
: 要么是个个人项目,连文档都没有(UJMP)

avatar
T*r
39
受教了,多谢!

出。

【在 N**Y 的大作中提到】
: 我说的直,见谅。
: 我在这些照片里只看到常见的浮华光影,色彩,构图。
: 看不到拍摄者的心,情绪,或与场景的互动关系。
: 这更像是欣赏,模仿大众“摄影“的美学受害者。
: 我也不知道如何说明白什么样的摄影不空洞,但是空洞如明信片般的摄影随处可见。
: 我去旅游的时候也有些这样类型的照片。没有你拍的好看。我不想把它们从相机里导出。
: 很多时候不空洞很难,但如果你暂时放开那些所谓的鲜艳色彩,平衡构图,美丽风景。
: 从平淡放松的角度诚实的拍出相机背后的自己, 也许你可以发现些不同。

avatar
z*e
40
hadoop和spark纷纷发来贺电

是C

【在 d****i 的大作中提到】
: 你完全搞错了,Java和JVM根本不是用来做数值计算的,Java和PHP一样适合业务逻辑,
: 不适合scientific computation。搞科学计算就是matlab, python, R,当然其实都是C
: 啦。

avatar
c*a
41


出。

【在 N**Y 的大作中提到】
: 我说的直,见谅。
: 我在这些照片里只看到常见的浮华光影,色彩,构图。
: 看不到拍摄者的心,情绪,或与场景的互动关系。
: 这更像是欣赏,模仿大众“摄影“的美学受害者。
: 我也不知道如何说明白什么样的摄影不空洞,但是空洞如明信片般的摄影随处可见。
: 我去旅游的时候也有些这样类型的照片。没有你拍的好看。我不想把它们从相机里导出。
: 很多时候不空洞很难,但如果你暂时放开那些所谓的鲜艳色彩,平衡构图,美丽风景。
: 从平淡放松的角度诚实的拍出相机背后的自己, 也许你可以发现些不同。

avatar
d*i
42
hadoop,spark这种也就是适合做做一般的ETL(数据量大一些而已),正经的高大上的
数值计算还得是MPI。

【在 z****e 的大作中提到】
: hadoop和spark纷纷发来贺电
:
: 是C

avatar
s*d
43
我觉得拍的很好看。
说实话,我也说得直一点,你这种看照片,或者说看问题的方式,就叫价值观单一
从某种程度上来说,就跟有人习惯性评论“有啥用?赚不到钱”一样
有没有经济效益确实是一种价值观,但不是唯一的价值观;有故事有思考不那么直白的
照片确实是好照片,但不是唯一的一种“好”的记录方式
何况你也说了,你相机里也有这样类型的照片,只是“不想把它们从相机里导出”。看
到这句话我就想呵呵

出。

【在 N**Y 的大作中提到】
: 我说的直,见谅。
: 我在这些照片里只看到常见的浮华光影,色彩,构图。
: 看不到拍摄者的心,情绪,或与场景的互动关系。
: 这更像是欣赏,模仿大众“摄影“的美学受害者。
: 我也不知道如何说明白什么样的摄影不空洞,但是空洞如明信片般的摄影随处可见。
: 我去旅游的时候也有些这样类型的照片。没有你拍的好看。我不想把它们从相机里导出。
: 很多时候不空洞很难,但如果你暂时放开那些所谓的鲜艳色彩,平衡构图,美丽风景。
: 从平淡放松的角度诚实的拍出相机背后的自己, 也许你可以发现些不同。

avatar
z*e
44
高大上没用,出来找工的话,hpc的经验约等于不存在
也就是物理系的那些千老在乎,其他系没多少人用
工业界的mpi要mainframe,去银行写cobol

【在 d****i 的大作中提到】
: hadoop,spark这种也就是适合做做一般的ETL(数据量大一些而已),正经的高大上的
: 数值计算还得是MPI。

avatar
E*e
45
XDDT

出。

【在 N**Y 的大作中提到】
: 我说的直,见谅。
: 我在这些照片里只看到常见的浮华光影,色彩,构图。
: 看不到拍摄者的心,情绪,或与场景的互动关系。
: 这更像是欣赏,模仿大众“摄影“的美学受害者。
: 我也不知道如何说明白什么样的摄影不空洞,但是空洞如明信片般的摄影随处可见。
: 我去旅游的时候也有些这样类型的照片。没有你拍的好看。我不想把它们从相机里导出。
: 很多时候不空洞很难,但如果你暂时放开那些所谓的鲜艳色彩,平衡构图,美丽风景。
: 从平淡放松的角度诚实的拍出相机背后的自己, 也许你可以发现些不同。

avatar
n*7
46
谢谢推荐scala
我找了找确实有不少
比如scalalab,好像很全
https://code.google.com/p/scalalab/
https://github.com/scalanlp/breeze/wiki/Linear-Algebra-Cheat-Sheet
这个breeze似乎跟numpy差不多
后台是netlib-java,这个玩意似乎很nb

【在 z****e 的大作中提到】
: scala的eco主要是typesafe做
: 知道james gosling吧?
: 这个家伙从google离职后就跑去type sofe忽悠了
: rod johnson就是那个做spring的也在typesafe
: java历史上的几个英雄人物,除了lars bak,其他基本上都在折腾scala
: 其实从vert.x的建造来看,其他语言都比较容易搞
: 但是唯独scala,复杂度偏高,不太容易搞
: 不是说越复杂越好,但是scala说自己是better java,不是完全没有道理的
: 其他语言的eco达不到这个程度,牛人不多
: 本来数学的东西就比较复杂,涉及到优化

avatar
s*r
47
我觉得一,三里面有作者的情绪和感情。杭州那张也不错,表现了古老的文化在现代文
明冲击下的挣扎和孤立的情绪。
avatar
n*7
48
因为python generally比java慢一个数量级
我写的code不可能只调用numpy的function
另外,java整个生态系统很强大
Java写多线程也很容易,我之前零经验,找着别人代码改改,一下子就work了
静态语言debug太爽了
还有,我对python前途没信心
python 2.x 到 3.x就是broken的
想起了perl 6的难产

【在 d********t 的大作中提到】
: 为毛用Java不用Python
avatar
T*r
49
你说的是保俶塔那一张?你说的和我想表现的差不多,不过我的想法更积极一点,下面
是我写的一小段介绍:
The first photo, I name it "This is China." The pagoda at near distance is
called Baochu Pagoda. It was built about one thousand years ago. At the far
distance are the buildings of modern Hangzhou. The meaning of the photo is
that China is a country under dramatic changes due to modernization. A few
things from the past are preserved, but majority part of country are brand
new and are still under heavy construction. During this period, we sacrifice
environment (the trees at near distance) for the development (the smog
around the city). Hopefully, things will improve as the growth slows down.

【在 s********r 的大作中提到】
: 我觉得一,三里面有作者的情绪和感情。杭州那张也不错,表现了古老的文化在现代文
: 明冲击下的挣扎和孤立的情绪。

avatar
n*7
50
我之前就用R python
matlab也偶尔用用
运行效率,通用性(MATLAB,R)和license (MATLAB) 是比较大的问题
我发现一个文章不错,基本都是我考虑的问题:
Scala as a platform for statistical computing and data science
avatar
n*7
51
看起来很牛X的样子,谢谢

【在 l*********s 的大作中提到】
: spark会是你的菜。
avatar
n*7
52
不知道什么样的project算高大上
反正我的账号一次最多动用500个core,java应该够了
而且java肯定在这方面比matlab, R,python要强吧
至于裸写C,很多时候又是overkill,java也就比C慢一倍左右,没有数量级差异
我这次决定写java之前专门google一下,发现欧洲宇航局的Gaia项目就是用java做HPC的
Gaia, the galaxy in 3D 这项目够高大上,够正经吧?
这里详细论述了用java的原因:
http://www.spscicomp.org/ScicomP15/slides/astro/torra.pdf
其中提到,有个function之前用C写的
后来这个作者用java改写了
作者对C比对java有经验多了,但是写出来的java code速度是C的4倍!

【在 d****i 的大作中提到】
: hadoop,spark这种也就是适合做做一般的ETL(数据量大一些而已),正经的高大上的
: 数值计算还得是MPI。

avatar
y*n
53
why not fortran?
avatar
t*n
54
不用纠结。随便google一下,用c++写的数值计算包到处都是。商业数值计算软件,没
有一个是用java写的。

【在 y*********n 的大作中提到】
: why not fortran?
avatar
n*7
55
不知道你的point是什么
我是需要一个这样的package,不是要用java写这样的一个package
这个package的核心是什么语言都无所谓
不然用matlab R numpy的都可以去死了

【在 t*****n 的大作中提到】
: 不用纠结。随便google一下,用c++写的数值计算包到处都是。商业数值计算软件,没
: 有一个是用java写的。

avatar
t*n
56
我的point就是:数值计算是c c++ FORTRAN的天下。你要找矩阵包,请放狗找eigen
ublas Atlas 等等。轮子太多了,不用自己造。

【在 n******7 的大作中提到】
: 不知道你的point是什么
: 我是需要一个这样的package,不是要用java写这样的一个package
: 这个package的核心是什么语言都无所谓
: 不然用matlab R numpy的都可以去死了

avatar
t*n
57
还有gsl。不知道你要用到那个领域。

【在 n******7 的大作中提到】
: 不知道你的point是什么
: 我是需要一个这样的package,不是要用java写这样的一个package
: 这个package的核心是什么语言都无所谓
: 不然用matlab R numpy的都可以去死了

avatar
t*n
58
手写c的事情基本没有意义了。gotoblas已经有汇编和sse优化。现在gpu搞矩阵也很流
行。

HPC的

【在 n******7 的大作中提到】
: 不知道什么样的project算高大上
: 反正我的账号一次最多动用500个core,java应该够了
: 而且java肯定在这方面比matlab, R,python要强吧
: 至于裸写C,很多时候又是overkill,java也就比C慢一倍左右,没有数量级差异
: 我这次决定写java之前专门google一下,发现欧洲宇航局的Gaia项目就是用java做HPC的
: Gaia, the galaxy in 3D 这项目够高大上,够正经吧?
: 这里详细论述了用java的原因:
: http://www.spscicomp.org/ScicomP15/slides/astro/torra.pdf
: 其中提到,有个function之前用C写的
: 后来这个作者用java改写了

avatar
n*7
59
eigen我是一直听说,因为不写cpp所以没有关注
不过你到是提醒我了,其实找个java wrapper就好
像eigen就有个jeigen,候选对象更多了,哈哈

【在 t*****n 的大作中提到】
: 我的point就是:数值计算是c c++ FORTRAN的天下。你要找矩阵包,请放狗找eigen
: ublas Atlas 等等。轮子太多了,不用自己造。

avatar
n*7
60
目前这个事其实主要是统计分析,
有一些矢量操作,不过计算量不在这里
所以想用线性代数的包,总比自己写循环效率高吧

【在 t*****n 的大作中提到】
: 还有gsl。不知道你要用到那个领域。
avatar
z*e
61
其他语言最大的问题在于平台的相关性太强
分布式现在基础都是hadoop那一套搞起来的
尤其是各种open source的工具
以后只会越来越强化这个平台
spark只是开始,r什么是比较傻瓜,但是各种不管
除非最后用的是excel来搞什么ml,否则没啥用

【在 n******7 的大作中提到】
: 我之前就用R python
: matlab也偶尔用用
: 运行效率,通用性(MATLAB,R)和license (MATLAB) 是比较大的问题
: 我发现一个文章不错,基本都是我考虑的问题:
: Scala as a platform for statistical computing and data science

avatar
t*n
62
gsl 就有统计模块。不过我也不熟。看看手册吧。不明白的是,为什么什么都要和Java
搞起来,这么怕写c++?

【在 n******7 的大作中提到】
: 目前这个事其实主要是统计分析,
: 有一些矢量操作,不过计算量不在这里
: 所以想用线性代数的包,总比自己写循环效率高吧

avatar
a*y
63
如果你需要用现成的算法, 最好找实现好的包. 千万不要自己写!
Fortran的包应该是最成熟也最完备的, 在某种程度上也是运行最快的. 就是不知
道你的语言能不能调用.
科学数值计算的实现有很多技巧, 不是简单地"翻译"数学公式和算法.
avatar
z*e
64
因为工业界主流是java
谁不想给自己简历上添加上那么一点跟big data相关的东西呢?
中介一看到hadoop这些都跟打了鸡血一样兴奋
至于具体gsl,中介知道这是啥玩意不?

Java

【在 t*****n 的大作中提到】
: gsl 就有统计模块。不过我也不熟。看看手册吧。不明白的是,为什么什么都要和Java
: 搞起来,这么怕写c++?

avatar
a*y
65
对, C++的包也很成熟.

Java

【在 t*****n 的大作中提到】
: gsl 就有统计模块。不过我也不熟。看看手册吧。不明白的是,为什么什么都要和Java
: 搞起来,这么怕写c++?

avatar
z*e
66
嗯,市场反应平淡
fortran就是千老的最爱

【在 a*********y 的大作中提到】
: 对, C++的包也很成熟.
:
: Java

avatar
a*y
67
问题是科学计算不是工业界的主流啊!

【在 z****e 的大作中提到】
: 因为工业界主流是java
: 谁不想给自己简历上添加上那么一点跟big data相关的东西呢?
: 中介一看到hadoop这些都跟打了鸡血一样兴奋
: 至于具体gsl,中介知道这是啥玩意不?
:
: Java

avatar
z*e
68

科学计算跟big data搞的统计应用不是一回事
统计应用甚至都谈不上什么“科学”,统计只是数学应用中相对低级的一个level
统计应用在统计里面则更为低级一点,科学数值计算适合搞物理的去弄
有hpc啥可以乱搞,工业界没有人用hpc,太贵用不起
所以强调分布式,因为cheap,网络当然比硬盘上的io要慢
但是cheap,所以都往网络上去挤

【在 a*********y 的大作中提到】
: 如果你需要用现成的算法, 最好找实现好的包. 千万不要自己写!
: Fortran的包应该是最成熟也最完备的, 在某种程度上也是运行最快的. 就是不知
: 道你的语言能不能调用.
: 科学数值计算的实现有很多技巧, 不是简单地"翻译"数学公式和算法.

avatar
z*e
69
没有错
科学计算是学术界的问题
楼主在问统计应用的pkg
显然跟工业界息息相关

【在 a*********y 的大作中提到】
: 问题是科学计算不是工业界的主流啊!
avatar
a*y
70
这话说得不对. Fortran 算是一种 DSL. 其它的语言再强大也替代不了. 青龙偃月刀用
来杀人行, 用来动手术肯定是不行的. :-)

【在 z****e 的大作中提到】
: 嗯,市场反应平淡
: fortran就是千老的最爱

avatar
n*7
71
我看了一下,gsl真不错
昨天刚有人推荐了一个用c做stats的书,我发现每页页眉上面都是gsl_stats
对,不想写c++
我写code只是为了实现我们设计的方法
实在不想花太多精力搞语言本身
java如果比c++跑起来慢一倍,但是写起来省一半时间的话
我还是愿意写java的
其实java和C我都可以接受
我一直觉得c要是有些好的package还是挺不错的
gsl看来值得一战

Java

【在 t*****n 的大作中提到】
: gsl 就有统计模块。不过我也不熟。看看手册吧。不明白的是,为什么什么都要和Java
: 搞起来,这么怕写c++?

avatar
n*7
72
另外我们最近要处理20TB的数据
我在琢磨怎么存储处理后的数据的问题
这个估计java也方便很多
一边load数据,处理,一边就存到database里面

Java

【在 t*****n 的大作中提到】
: gsl 就有统计模块。不过我也不熟。看看手册吧。不明白的是,为什么什么都要和Java
: 搞起来,这么怕写c++?

avatar
z*e
73
我的感觉基本上整个欧洲的学术界的工具都在往scala上转移
我们这边跟欧洲关系远比美帝的关系要密切得多
绝大多数叫兽都是欧洲人,可以明显感觉到,scala的火热
不管做啥,只要欧洲来的叫兽坐阵,语言你就得用scala
尤其是big data相关的东西,都是scala,当然这个刚开始做没多久
很多工具肯定不如那些几十年做下来的傻瓜容易,比如r
但是这个是future,现在统计应用就是big data上需要嘛
你问的线性代数估计就是相似度判断,vsm那些东西
用scala,spark这些吧,包括hdfs什么都是你可能会用到的工具
看了你的主贴还在扯蛋数值计算的基本上都是不懂big data的

【在 n******7 的大作中提到】
: 我之前就用R python
: matlab也偶尔用用
: 运行效率,通用性(MATLAB,R)和license (MATLAB) 是比较大的问题
: 我发现一个文章不错,基本都是我考虑的问题:
: Scala as a platform for statistical computing and data science

avatar
z*e
74
不冲突

【在 a*********y 的大作中提到】
: 这话说得不对. Fortran 算是一种 DSL. 其它的语言再强大也替代不了. 青龙偃月刀用
: 来杀人行, 用来动手术肯定是不行的. :-)

avatar
n*7
75
我最近被R的type问题搞怒了
本来一个code跑的好好的,没任何问题
后来加了个feature selection就不对了
研究一下发现,R slice 矩阵的时候,如果只选一行
默认返回的不是个1-row 矩阵,而是自动转换成vector
nrow函数给出的就不是1,而是null
太坑爹了

【在 z****e 的大作中提到】
: 其他语言最大的问题在于平台的相关性太强
: 分布式现在基础都是hadoop那一套搞起来的
: 尤其是各种open source的工具
: 以后只会越来越强化这个平台
: spark只是开始,r什么是比较傻瓜,但是各种不管
: 除非最后用的是excel来搞什么ml,否则没啥用

avatar
n*7
76
算是用现成的算法,不过还是有些东西很直白,也用不上什么library
比如E-M 优化,E-step M-step 弄好了,就是写循环了

【在 a*********y 的大作中提到】
: 如果你需要用现成的算法, 最好找实现好的包. 千万不要自己写!
: Fortran的包应该是最成熟也最完备的, 在某种程度上也是运行最快的. 就是不知
: 道你的语言能不能调用.
: 科学数值计算的实现有很多技巧, 不是简单地"翻译"数学公式和算法.

avatar
a*y
77
估计 Fortran 就没有这个问题. 矩阵也好, 向量也好, 都是数组.
不过你的项目还得具体问题具体分析.

【在 n******7 的大作中提到】
: 我最近被R的type问题搞怒了
: 本来一个code跑的好好的,没任何问题
: 后来加了个feature selection就不对了
: 研究一下发现,R slice 矩阵的时候,如果只选一行
: 默认返回的不是个1-row 矩阵,而是自动转换成vector
: nrow函数给出的就不是1,而是null
: 太坑爹了

avatar
n*7
78
fortran的向量也没有row number这个属性吧?
这里的问题是,R这个type转换完全瞎搞
我看别人写的,R处理type是靠猜的
估计它看到一个一行的矩阵就认为是vector了
本身又是动态语言,又慢
这种问题要跑半天,然后给你个错误死掉,谁受得了

【在 a*********y 的大作中提到】
: 估计 Fortran 就没有这个问题. 矩阵也好, 向量也好, 都是数组.
: 不过你的项目还得具体问题具体分析.

avatar
w*m
79
其实工业界和学术界差不多,别人怎么做就自己怎么做.
你这个估计是学术界的项目,查查文章就行了.弄一下发了文章走路,不用太纠结.
avatar
n*7
80
对,数据是很多
未来10年大数据处理在医疗健康领域会越来越重要

【在 z****e 的大作中提到】
: 我的感觉基本上整个欧洲的学术界的工具都在往scala上转移
: 我们这边跟欧洲关系远比美帝的关系要密切得多
: 绝大多数叫兽都是欧洲人,可以明显感觉到,scala的火热
: 不管做啥,只要欧洲来的叫兽坐阵,语言你就得用scala
: 尤其是big data相关的东西,都是scala,当然这个刚开始做没多久
: 很多工具肯定不如那些几十年做下来的傻瓜容易,比如r
: 但是这个是future,现在统计应用就是big data上需要嘛
: 你问的线性代数估计就是相似度判断,vsm那些东西
: 用scala,spark这些吧,包括hdfs什么都是你可能会用到的工具
: 看了你的主贴还在扯蛋数值计算的基本上都是不懂big data的

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。