avatar
data scientist的五个方面# DataSciences - 数据科学
e*n
1
1. programming: Java, Python, C++, Ruby, Matlab, Perl
2. Database: SQL, NonSQL (HBase, MongoDB)
3. Statistics: R, SPSS, SAS, A/B testing, Tableau (Visualization)
4. Hadoop: MapReduce, Hive, Pig
5. Machine Learning: Predictive Modeling, Neural Networks, Regression,
Clustering, Decision Trees (CART), Boostrapping, Random Forest,
Collaborative Filtering, Text Mining, Social Network Analysis,
Recommendation
看了很多data scientist的招聘要求,总结出来的五个方面
avatar
r*d
2
mark!
avatar
z*e
3
不用搞那么麻烦
其实就是最基本的
编程基础,这个会java,python,再对常见类库熟悉一下
就可以了,这两个随便一个展开都是非常大的topic
你一辈子学都学不完,公司不可能要求你全部都懂的
然后是理论基础,统计知识这些
hadoop这些严格说来只是一个工具,懂得利用这些工具就好了
avatar
f*y
4
赞楼主的Summary!

【在 e*******n 的大作中提到】
: 1. programming: Java, Python, C++, Ruby, Matlab, Perl
: 2. Database: SQL, NonSQL (HBase, MongoDB)
: 3. Statistics: R, SPSS, SAS, A/B testing, Tableau (Visualization)
: 4. Hadoop: MapReduce, Hive, Pig
: 5. Machine Learning: Predictive Modeling, Neural Networks, Regression,
: Clustering, Decision Trees (CART), Boostrapping, Random Forest,
: Collaborative Filtering, Text Mining, Social Network Analysis,
: Recommendation
: 看了很多data scientist的招聘要求,总结出来的五个方面

avatar
j*n
5
totally agree. programming + math, all you need.

【在 z****e 的大作中提到】
: 不用搞那么麻烦
: 其实就是最基本的
: 编程基础,这个会java,python,再对常见类库熟悉一下
: 就可以了,这两个随便一个展开都是非常大的topic
: 你一辈子学都学不完,公司不可能要求你全部都懂的
: 然后是理论基础,统计知识这些
: hadoop这些严格说来只是一个工具,懂得利用这些工具就好了

avatar
h*0
6
1) sparse index implication
2) framework in processing data across machine boundary
???
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。