data science如何进阶?# Programming - 葵花宝典
f*n
1 楼
小弟我从生物信息phd想转到data science
自己做过的有NGS-genomics之类的研究
也做过基于clinical feature 用ML进行phenotype prediction的研究
熟悉linux/hpcc,R,尤其是python(Numpy, Scripy, Matplotlib, Pandas, Scikit-
learn)这一套
学习了bishop的PRML,当然也补课了multi calculus,和线性代数
也刷过一些kaggle
刷kaggle和自己的phenotype prediction的套路都是:
feature engineering, data cleaning, machine learning data training, test
prediction, data visulization
请问掌握这些我算是入门了吗?
如果入门了的话,如何进阶呢?
是继续加深我的machine learning/数学的基础知识,以及加强python coding能力 (
我的自学当然不能跟科班比)
还是继续学习新的东西,比如mapreduce,Hadoop,NLP,deep learning之类的?
我有想过data science和CS两条出路,我觉得CS工作更多,而且基本上刷题就可以,目
标明确
但我对data sci更有兴趣,而且跟我的bioinformatics背景更加match
另外我觉得是不是data sci就那么些套路,比较简单?(或许我想错了?)
谢谢大家
自己做过的有NGS-genomics之类的研究
也做过基于clinical feature 用ML进行phenotype prediction的研究
熟悉linux/hpcc,R,尤其是python(Numpy, Scripy, Matplotlib, Pandas, Scikit-
learn)这一套
学习了bishop的PRML,当然也补课了multi calculus,和线性代数
也刷过一些kaggle
刷kaggle和自己的phenotype prediction的套路都是:
feature engineering, data cleaning, machine learning data training, test
prediction, data visulization
请问掌握这些我算是入门了吗?
如果入门了的话,如何进阶呢?
是继续加深我的machine learning/数学的基础知识,以及加强python coding能力 (
我的自学当然不能跟科班比)
还是继续学习新的东西,比如mapreduce,Hadoop,NLP,deep learning之类的?
我有想过data science和CS两条出路,我觉得CS工作更多,而且基本上刷题就可以,目
标明确
但我对data sci更有兴趣,而且跟我的bioinformatics背景更加match
另外我觉得是不是data sci就那么些套路,比较简单?(或许我想错了?)
谢谢大家