data science如何进阶？ - 未名空间MITBBS历史存档

国际科技财经博客移民网络热点娱乐民生时事公众号

Redian新闻

>未名空间

>Programming - 葵花宝典

data science如何进阶？

data science如何进阶？# Programming - 葵花宝典

f*n2017-04-13 07:04

1 楼

小弟我从生物信息phd想转到data science
自己做过的有NGS-genomics之类的研究
也做过基于clinical feature 用ML进行phenotype prediction的研究
熟悉linux/hpcc，R，尤其是python（Numpy, Scripy, Matplotlib, Pandas, Scikit-
learn）这一套
学习了bishop的PRML，当然也补课了multi calculus，和线性代数
也刷过一些kaggle
刷kaggle和自己的phenotype prediction的套路都是：
feature engineering, data cleaning, machine learning data training, test
prediction, data visulization
请问掌握这些我算是入门了吗？
如果入门了的话，如何进阶呢？
是继续加深我的machine learning/数学的基础知识，以及加强python coding能力（
我的自学当然不能跟科班比）
还是继续学习新的东西，比如mapreduce，Hadoop，NLP，deep learning之类的？
我有想过data science和CS两条出路，我觉得CS工作更多，而且基本上刷题就可以，目
标明确
但我对data sci更有兴趣，而且跟我的bioinformatics背景更加match
另外我觉得是不是data sci就那么些套路，比较简单？（或许我想错了？）
谢谢大家