avatar
data science如何进阶?# Programming - 葵花宝典
f*n
1
小弟我从生物信息phd想转到data science
自己做过的有NGS-genomics之类的研究
也做过基于clinical feature 用ML进行phenotype prediction的研究
熟悉linux/hpcc,R,尤其是python(Numpy, Scripy, Matplotlib, Pandas, Scikit-
learn)这一套
学习了bishop的PRML,当然也补课了multi calculus,和线性代数
也刷过一些kaggle
刷kaggle和自己的phenotype prediction的套路都是:
feature engineering, data cleaning, machine learning data training, test
prediction, data visulization
请问掌握这些我算是入门了吗?
如果入门了的话,如何进阶呢?
是继续加深我的machine learning/数学的基础知识,以及加强python coding能力 (
我的自学当然不能跟科班比)
还是继续学习新的东西,比如mapreduce,Hadoop,NLP,deep learning之类的?
我有想过data science和CS两条出路,我觉得CS工作更多,而且基本上刷题就可以,目
标明确
但我对data sci更有兴趣,而且跟我的bioinformatics背景更加match
另外我觉得是不是data sci就那么些套路,比较简单?(或许我想错了?)
谢谢大家
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。