Redian新闻
>
为什么很多数据挖掘的开发包都是用Python或R写的?
avatar
为什么很多数据挖掘的开发包都是用Python或R写的?# Programming - 葵花宝典
s*n
1
又有新玩具 呵呵~
avatar
s*y
2
很多数据挖掘的开发包都是用Python或R写的,为什么不是C++或者Java?
我不懂Python,Python比Java好在哪里?
avatar
i*f
3
恭喜。等上片。

【在 s*****n 的大作中提到】
: 又有新玩具 呵呵~
avatar
z*e
4
lol,说明python高大上,应该好好学习python
祝你以后找到“数据挖掘”的工作
avatar
s*n
5
呵呵 就是看上那个德頭 我看无忌上拍的照片很德味啊~

【在 i***f 的大作中提到】
: 恭喜。等上片。
avatar
w*g
6
java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
C++ 11了好很多,以前经常需要写诸如map, string>::const_
iterator这
种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
别的都好多了。我都是等编译的时候过来发帖子的。
如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
.h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。
好处也很明显,如果写得好的话程序运行起来比编译还快。别人一个model要算一天,
我一个小时不到就算出来了。这两天搞一个机器学习比赛,我知道一个用C++核心加
perl的,算一个model要5个小时。我纯C++的1个小时就出来结果了,我可以比他多试
好几种参数,效果很明显。

【在 s****y 的大作中提到】
: 很多数据挖掘的开发包都是用Python或R写的,为什么不是C++或者Java?
: 我不懂Python,Python比Java好在哪里?

avatar
e*b
7
还是大C,不错
avatar
l*m
8
clang 是不是快些

【在 w***g 的大作中提到】
: java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
: 倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
: C++ 11了好很多,以前经常需要写诸如map, string>::const_
: iterator这
: 种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
: 超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
: 别的都好多了。我都是等编译的时候过来发帖子的。
: 如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
: .h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
: 还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。

avatar
s*n
9
谢谢~~ 正好看到了 大c小c我都可以接受 反正没可能换镜头~ 不过大c说是取景器更大
更明亮些

【在 e********b 的大作中提到】
: 还是大C,不错
avatar
e*b
11
可以换镜头的 。。。当然是大C更爽,哈哈

【在 s*****n 的大作中提到】
: 谢谢~~ 正好看到了 大c小c我都可以接受 反正没可能换镜头~ 不过大c说是取景器更大
: 更明亮些

avatar
z*e
12
楼主挖个坑你还当真了
我问你
有几个python/r的pkg是python/r写的?
你还这么认真地写了一大段
幼稚了不是?

【在 w***g 的大作中提到】
: java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
: 倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
: C++ 11了好很多,以前经常需要写诸如map, string>::const_
: iterator这
: 种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
: 超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
: 别的都好多了。我都是等编译的时候过来发帖子的。
: 如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
: .h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
: 还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。

avatar
s*n
13
我知道 但感觉买不到了。。。大哥你上片啊~~~

【在 e********b 的大作中提到】
: 可以换镜头的 。。。当然是大C更爽,哈哈
avatar
s*y
14

多谢wdong

【在 w***g 的大作中提到】
: java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
: 倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
: C++ 11了好很多,以前经常需要写诸如map, string>::const_
: iterator这
: 种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
: 超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
: 别的都好多了。我都是等编译的时候过来发帖子的。
: 如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
: .h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
: 还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。

avatar
b*g
15
恭喜。昨天看一个iia heligon 50/2,卖家不知道xenon heligon的区别标的低价,最后
还是没有下手,太多了玩不转。
avatar
s*y
16

我没有挖坑啊
因为我发现只有少数开发包是用java写的,比如OpenNLP

【在 z****e 的大作中提到】
: 楼主挖个坑你还当真了
: 我问你
: 有几个python/r的pkg是python/r写的?
: 你还这么认真地写了一大段
: 幼稚了不是?

avatar
l*a
17
大侠,是这个吗?

【在 b*****g 的大作中提到】
: 恭喜。昨天看一个iia heligon 50/2,卖家不知道xenon heligon的区别标的低价,最后
: 还是没有下手,太多了玩不转。

avatar
z*e
18
wdong跟你说个open nlp你就知道open nlp了?
主流是stanford nlp
http://nlp.stanford.edu/
搞nlp当然要看死蛋佛在干哈了
google就是从死蛋佛发家的
python和r的包几乎都是c/c++/fortran这些语言写的
jvm上的r刚刚起步,毕竟r是比较专业的软件
要全部做一遍下来,还需要时间
jvm对于pkg有比较高的要求,至少要跨平台所以要搞成字节码这些
这些都是门槛,而搞成r或者python的pkg则没有这么高的门槛
尤其是python,很容易就包装过去了,所以一般会先于jvm上的pkg推出来
但是这些pkg普遍质量不行,对平台有各种狗屎要求
安装起来要这样要那样,不胜其烦,工业界本来os就很多样
所以这些包用起来都很痛苦,磨合有阵痛
现在是一步一步去往jvm上搬
主要工具就是scala去一点一点写,所以才有spark,renjin这些

【在 s****y 的大作中提到】
:
: 我没有挖坑啊
: 因为我发现只有少数开发包是用java写的,比如OpenNLP

avatar
l*a
19
LZ 啊,我泪流了,这货太美太相思了~~~上海海鸥~~~
avatar
w*g
20
我回帖里说了斯坦福了,这个不是我的责任。

【在 z****e 的大作中提到】
: wdong跟你说个open nlp你就知道open nlp了?
: 主流是stanford nlp
: http://nlp.stanford.edu/
: 搞nlp当然要看死蛋佛在干哈了
: google就是从死蛋佛发家的
: python和r的包几乎都是c/c++/fortran这些语言写的
: jvm上的r刚刚起步,毕竟r是比较专业的软件
: 要全部做一遍下来,还需要时间
: jvm对于pkg有比较高的要求,至少要跨平台所以要搞成字节码这些
: 这些都是门槛,而搞成r或者python的pkg则没有这么高的门槛

avatar
b*g
21
是。最小的50/2。可惜很少见不锈不掉漆的。据说heligon更锐,据说而已。

【在 l***a 的大作中提到】
: 大侠,是这个吗?
avatar
N*K
22
c++11非常好 用ssd + 快的cpu
写头文件有个好处 就是当文档使用
python这个垃圾 看着就恶心

【在 w***g 的大作中提到】
: java我不清楚。我自己用C++做机器学习的,缺点很明显,就是编译一次要等半天。
: 倒不用跟java那样catch exception,但写程序显然还是没有python方便。现在
: C++ 11了好很多,以前经常需要写诸如map, string>::const_
: iterator这
: 种P用没有的代码,绝对令人抓狂。做机器学习几分钟要换个model,C++如果不是
: 超级熟练的话显然适应不了需求。现在上了C++11后我觉得除了编译还是一样慢,
: 别的都好多了。我都是等编译的时候过来发帖子的。
: 如果想编译快也可以,所有的东西.h文件写一遍, .cpp文件再写一遍,拿天要改了
: .h文件改一遍,.cpp文件再改一边,很容易就精神分裂了。全都写.h里除了编译慢
: 还有一个坏处,就是stack dump的时候全都缩到一个函数里面去了,啥信息都找不到。

avatar
l*a
23
另外问问,
瞄上一个很美的海鸥双反 4A-103,可惜快门坏了。这种修起来难吗? 多谢。

【在 b*****g 的大作中提到】
: 是。最小的50/2。可惜很少见不锈不掉漆的。据说heligon更锐,据说而已。
avatar
d*e
24
可视化。
楼下得都是马工,没有太多dm或者ml得经验。
你开始不知道什么。必须处理原始数据和作图找关系。
你用C++?我都分析好几论特征了。

【在 s****y 的大作中提到】
: 很多数据挖掘的开发包都是用Python或R写的,为什么不是C++或者Java?
: 我不懂Python,Python比Java好在哪里?

avatar
b*g
25
没玩过,哈哈。另外你可以查查镜片是3还是4片,4片好点吧。

【在 l***a 的大作中提到】
: 另外问问,
: 瞄上一个很美的海鸥双反 4A-103,可惜快门坏了。这种修起来难吗? 多谢。

avatar
g*e
26
python只是driver script 调用c的包
avatar
l*a
27
酱紫啊。。。
挺国货,找了个好的加入bid..

【在 b*****g 的大作中提到】
: 没玩过,哈哈。另外你可以查查镜片是3还是4片,4片好点吧。
avatar
N*K
28
2维的数据?

【在 d******e 的大作中提到】
: 可视化。
: 楼下得都是马工,没有太多dm或者ml得经验。
: 你开始不知道什么。必须处理原始数据和作图找关系。
: 你用C++?我都分析好几论特征了。

avatar
i*f
29
不能收到就拍的器材一律过。

【在 l***a 的大作中提到】
: 另外问问,
: 瞄上一个很美的海鸥双反 4A-103,可惜快门坏了。这种修起来难吗? 多谢。

avatar
d*e
30
多维的可以一对一对找关系
任何dm 的第一步都是先 explore数据

【在 N******K 的大作中提到】
: 2维的数据?
avatar
s*n
31
人在德国 当然只收德机啊~~~xmjdh

【在 l***a 的大作中提到】
: 酱紫啊。。。
: 挺国货,找了个好的加入bid..

avatar
r*g
32
赞。做研究脚本语言很好。

【在 d******e 的大作中提到】
: 可视化。
: 楼下得都是马工,没有太多dm或者ml得经验。
: 你开始不知道什么。必须处理原始数据和作图找关系。
: 你用C++?我都分析好几论特征了。

avatar
N*K
33
用2维研究高维?

【在 d******e 的大作中提到】
: 多维的可以一对一对找关系
: 任何dm 的第一步都是先 explore数据

avatar
d*n
36
因为人眼只能看到2维。

【在 N******K 的大作中提到】
: 用2维研究高维?
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。