s*y
2 楼
很多数据挖掘的开发包都是用Python或R写的,为什么不是C++或者Java?
我不懂Python,Python比Java好在哪里?
我不懂Python,Python比Java好在哪里?
z*e
4 楼
lol,说明python高大上,应该好好学习python
祝你以后找到“数据挖掘”的工作
祝你以后找到“数据挖掘”的工作
w*g
6 楼
java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
C++ 11了好很多,以前经常需要写诸如map, string>::const_
iterator这
种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
别的都好多了。我都是等编译的时候过来发帖子的。
如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
.h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。
好处也很明显,如果写得好的话程序运行起来比编译还快。别人一个model要算一天,
我一个小时不到就算出来了。这两天搞一个机器学习比赛,我知道一个用C++核心加
perl的,算一个model要5个小时。我纯C++的1个小时就出来结果了,我可以比他多试
好几种参数,效果很明显。
【在 s****y 的大作中提到】
: 很多数据挖掘的开发包都是用Python或R写的,为什么不是C++或者Java?
: 我不懂Python,Python比Java好在哪里?
倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
C++ 11了好很多,以前经常需要写诸如map
iterator这
种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
别的都好多了。我都是等编译的时候过来发帖子的。
如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
.h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。
好处也很明显,如果写得好的话程序运行起来比编译还快。别人一个model要算一天,
我一个小时不到就算出来了。这两天搞一个机器学习比赛,我知道一个用C++核心加
perl的,算一个model要5个小时。我纯C++的1个小时就出来结果了,我可以比他多试
好几种参数,效果很明显。
【在 s****y 的大作中提到】
: 很多数据挖掘的开发包都是用Python或R写的,为什么不是C++或者Java?
: 我不懂Python,Python比Java好在哪里?
e*b
7 楼
还是大C,不错
l*m
8 楼
clang 是不是快些
【在 w***g 的大作中提到】
: java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
: 倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
: C++ 11了好很多,以前经常需要写诸如map, string>::const_
: iterator这
: 种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
: 超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
: 别的都好多了。我都是等编译的时候过来发帖子的。
: 如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
: .h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
: 还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。
【在 w***g 的大作中提到】
: java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
: 倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
: C++ 11了好很多,以前经常需要写诸如map
: iterator这
: 种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
: 超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
: 别的都好多了。我都是等编译的时候过来发帖子的。
: 如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
: .h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
: 还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。
w*g
10 楼
clang比较新,各种东西都没有gcc成熟。性能也不是什么情况下都快,比如openmp就没
有gcc好。
http://www.phoronix.com/scan.php?page=article&item=llvm_clang_o
【在 l*******m 的大作中提到】
: clang 是不是快些
有gcc好。
http://www.phoronix.com/scan.php?page=article&item=llvm_clang_o
【在 l*******m 的大作中提到】
: clang 是不是快些
z*e
12 楼
楼主挖个坑你还当真了
我问你
有几个python/r的pkg是python/r写的?
你还这么认真地写了一大段
幼稚了不是?
【在 w***g 的大作中提到】
: java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
: 倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
: C++ 11了好很多,以前经常需要写诸如map, string>::const_
: iterator这
: 种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
: 超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
: 别的都好多了。我都是等编译的时候过来发帖子的。
: 如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
: .h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
: 还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。
我问你
有几个python/r的pkg是python/r写的?
你还这么认真地写了一大段
幼稚了不是?
【在 w***g 的大作中提到】
: java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
: 倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
: C++ 11了好很多,以前经常需要写诸如map
: iterator这
: 种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
: 超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
: 别的都好多了。我都是等编译的时候过来发帖子的。
: 如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
: .h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
: 还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。
s*y
14 楼
多谢wdong
【在 w***g 的大作中提到】
: java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
: 倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
: C++ 11了好很多,以前经常需要写诸如map
: iterator这
: 种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
: 超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
: 别的都好多了。我都是等编译的时候过来发帖子的。
: 如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
: .h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
: 还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。
b*g
15 楼
恭喜。昨天看一个iia heligon 50/2,卖家不知道xenon heligon的区别标的低价,最后
还是没有下手,太多了玩不转。
还是没有下手,太多了玩不转。
z*e
18 楼
wdong跟你说个open nlp你就知道open nlp了?
主流是stanford nlp
http://nlp.stanford.edu/
搞nlp当然要看死蛋佛在干哈了
google就是从死蛋佛发家的
python和r的包几乎都是c/c++/fortran这些语言写的
jvm上的r刚刚起步,毕竟r是比较专业的软件
要全部做一遍下来,还需要时间
jvm对于pkg有比较高的要求,至少要跨平台所以要搞成字节码这些
这些都是门槛,而搞成r或者python的pkg则没有这么高的门槛
尤其是python,很容易就包装过去了,所以一般会先于jvm上的pkg推出来
但是这些pkg普遍质量不行,对平台有各种狗屎要求
安装起来要这样要那样,不胜其烦,工业界本来os就很多样
所以这些包用起来都很痛苦,磨合有阵痛
现在是一步一步去往jvm上搬
主要工具就是scala去一点一点写,所以才有spark,renjin这些
【在 s****y 的大作中提到】
:
: 我没有挖坑啊
: 因为我发现只有少数开发包是用java写的,比如OpenNLP
主流是stanford nlp
http://nlp.stanford.edu/
搞nlp当然要看死蛋佛在干哈了
google就是从死蛋佛发家的
python和r的包几乎都是c/c++/fortran这些语言写的
jvm上的r刚刚起步,毕竟r是比较专业的软件
要全部做一遍下来,还需要时间
jvm对于pkg有比较高的要求,至少要跨平台所以要搞成字节码这些
这些都是门槛,而搞成r或者python的pkg则没有这么高的门槛
尤其是python,很容易就包装过去了,所以一般会先于jvm上的pkg推出来
但是这些pkg普遍质量不行,对平台有各种狗屎要求
安装起来要这样要那样,不胜其烦,工业界本来os就很多样
所以这些包用起来都很痛苦,磨合有阵痛
现在是一步一步去往jvm上搬
主要工具就是scala去一点一点写,所以才有spark,renjin这些
【在 s****y 的大作中提到】
:
: 我没有挖坑啊
: 因为我发现只有少数开发包是用java写的,比如OpenNLP
l*a
19 楼
LZ 啊,我泪流了,这货太美太相思了~~~上海海鸥~~~
w*g
20 楼
我回帖里说了斯坦福了,这个不是我的责任。
【在 z****e 的大作中提到】
: wdong跟你说个open nlp你就知道open nlp了?
: 主流是stanford nlp
: http://nlp.stanford.edu/
: 搞nlp当然要看死蛋佛在干哈了
: google就是从死蛋佛发家的
: python和r的包几乎都是c/c++/fortran这些语言写的
: jvm上的r刚刚起步,毕竟r是比较专业的软件
: 要全部做一遍下来,还需要时间
: jvm对于pkg有比较高的要求,至少要跨平台所以要搞成字节码这些
: 这些都是门槛,而搞成r或者python的pkg则没有这么高的门槛
【在 z****e 的大作中提到】
: wdong跟你说个open nlp你就知道open nlp了?
: 主流是stanford nlp
: http://nlp.stanford.edu/
: 搞nlp当然要看死蛋佛在干哈了
: google就是从死蛋佛发家的
: python和r的包几乎都是c/c++/fortran这些语言写的
: jvm上的r刚刚起步,毕竟r是比较专业的软件
: 要全部做一遍下来,还需要时间
: jvm对于pkg有比较高的要求,至少要跨平台所以要搞成字节码这些
: 这些都是门槛,而搞成r或者python的pkg则没有这么高的门槛
N*K
22 楼
c++11非常好 用ssd + 快的cpu
写头文件有个好处 就是当文档使用
python这个垃圾 看着就恶心
【在 w***g 的大作中提到】
: java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
: 倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
: C++ 11了好很多,以前经常需要写诸如map, string>::const_
: iterator这
: 种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
: 超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
: 别的都好多了。我都是等编译的时候过来发帖子的。
: 如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
: .h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
: 还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。
写头文件有个好处 就是当文档使用
python这个垃圾 看着就恶心
【在 w***g 的大作中提到】
: java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
: 倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
: C++ 11了好很多,以前经常需要写诸如map
: iterator这
: 种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
: 超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
: 别的都好多了。我都是等编译的时候过来发帖子的。
: 如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
: .h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
: 还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。
g*e
26 楼
python只是driver script 调用c的包
d*e
34 楼
http://gettinggeneticsdone.blogspot.com/2011/07/scatterplot-mat
【在 N******K 的大作中提到】
: 用2维研究高维?
【在 N******K 的大作中提到】
: 用2维研究高维?
N*K
35 楼
两个互相比 就是用2维研究高维 包括用pca看前两个主成分
【在 d******e 的大作中提到】
: http://gettinggeneticsdone.blogspot.com/2011/07/scatterplot-mat
【在 d******e 的大作中提到】
: http://gettinggeneticsdone.blogspot.com/2011/07/scatterplot-mat
相关阅读
Re: [转载] Re: BT实战请教一个在 AIX 下编译运行的问题如何实现 Meta Seach我心目中的编程高手a question about virtual memory请问有哪些high performance TCP statck on LINUX?cgi测试newbee问题isinf 问题how to initialize this struct.[转载] java问题:如何match两个正规表达式ask a C question about random number怎样阻止MenuSelect事件Block住程序运行?Access 编程急问!!小问题一个[转载] Re: emacs 还是比较麻烦Source Control/Issue Tracking software? (转载)an excel questionRe: 这样做是否现实,如何做? (转载)如何实现向另一个应用程序(不是自己编的,没有原码)添加功能一个怪怪的bug[转载] Is there any tools in Linux to watch mem