Redian新闻
>
想当数据科学家如何选课
avatar
想当数据科学家如何选课# JobHunting - 待字闺中
Q*1
1
不知道版面发得对不对,就暂时放到job hunting 版吧。
先简要介绍一下我的情况,我本科是数学的,修了一些统计的课程多元统计,时间序列
分析,计量经济学。现在在美帝东北部一所理工类大学读data science master。 第一
个学期学了数据库和统计学习。这个学期打算选big data management(教hadoop
mapreduce),Data Mining。这两门课都是课量比较大的。
其实也不太清楚到底该不该学data mining,因为感觉好多东西都在统计学习那门课都
学过了。然后主要是最后一门课就比较纠结了。可选的有回归分析(其实不太想选本科
的计量经济学就学的就是回归分析),贝叶斯统计(这个据说在data science领域很有
用?),biovisulization(数据可视化的,但是坑爹的是应用于生物数据,听到bio有
点反感)。最后就是software system design(软件工程主要用java),因为这门课比
较popular,各种专业的人抢着来上这门课,所以我现在暂时是占着这个坑的。
最后这门课要求的coding比较多,根据同学们反映这门课也能够学到很多东西,很门很
有含金量课。选这门课也是为了熟练一下java编程。问题是这门课比较demanding,如
果真的选了这门课就估计没什么时间再跟网上的算法公开课了,也更加没时间刷算法题
了准备暑期实习了(貌似找data scientist工作也要刷题?)。 而且就和data
science的相关性来看,这门课好像和数据科学没多大的关系。
所以最后很是纠结到底选那门课比较好。求版上的大神们给点建议哈。谢谢了。
avatar
E*F
2
东西当然是会得越多越好
不过如果你想当data scientist的话,software design没太大用,面试也不会考
你如果以前对贝叶斯不太了解的,应该学一下
这个名字下有很多不同的内容,比如有的只是在回归的基础上加上prior
有的则是搞出贝叶斯网络,马科夫网络啥的,跟传统统计差别很大

【在 Q*******1 的大作中提到】
: 不知道版面发得对不对,就暂时放到job hunting 版吧。
: 先简要介绍一下我的情况,我本科是数学的,修了一些统计的课程多元统计,时间序列
: 分析,计量经济学。现在在美帝东北部一所理工类大学读data science master。 第一
: 个学期学了数据库和统计学习。这个学期打算选big data management(教hadoop
: mapreduce),Data Mining。这两门课都是课量比较大的。
: 其实也不太清楚到底该不该学data mining,因为感觉好多东西都在统计学习那门课都
: 学过了。然后主要是最后一门课就比较纠结了。可选的有回归分析(其实不太想选本科
: 的计量经济学就学的就是回归分析),贝叶斯统计(这个据说在data science领域很有
: 用?),biovisulization(数据可视化的,但是坑爹的是应用于生物数据,听到bio有
: 点反感)。最后就是software system design(软件工程主要用java),因为这门课比

avatar
Q*1
3
贝叶斯统计在数据科学领域的有用吗?感觉就本科学概率论的时候学了一点贝叶斯公式
,然后根据先验概率求后验概率啊啥的。感觉不知道就这点东西,能够单独成为一门知
识呀。

【在 E*******F 的大作中提到】
: 东西当然是会得越多越好
: 不过如果你想当data scientist的话,software design没太大用,面试也不会考
: 你如果以前对贝叶斯不太了解的,应该学一下
: 这个名字下有很多不同的内容,比如有的只是在回归的基础上加上prior
: 有的则是搞出贝叶斯网络,马科夫网络啥的,跟传统统计差别很大

avatar
E*F
4
本科概率课上的例子大概都是一维的情况吧
如果是高维数据,贝叶斯统计可以变得很复杂
比如这样一个应用:
考试成绩和志愿共同决定录取结果(概率意义上的),
录取结果和身高决定毕业工资
身高和工资又共同决定老婆水平
这些都给你一些数据去算条件概率
下面求考试成绩为600分,身高160cm时,娶到凤姐的边缘概率是多大
再求已知娶到凤姐时,当初录取到北大生物系的概率
这个本科那种例子大概就搞不定了

【在 Q*******1 的大作中提到】
: 贝叶斯统计在数据科学领域的有用吗?感觉就本科学概率论的时候学了一点贝叶斯公式
: ,然后根据先验概率求后验概率啊啥的。感觉不知道就这点东西,能够单独成为一门知
: 识呀。

avatar
Q*1
5
那贝叶斯统计会在面试中问吗?
avatar
s*0
6
machine learning, python,R sas, time series, statistic inference
avatar
e*s
7
谁会问这种1+1地问题...

【在 Q*******1 的大作中提到】
: 那贝叶斯统计会在面试中问吗?
avatar
x*1
8
Bayes rule 那类很简单了。 bayesian network及其各种衍生模型比较难,跟很多高级
模型都有关,建议基础打扎实些。

【在 Q*******1 的大作中提到】
: 那贝叶斯统计会在面试中问吗?
avatar
W*o
9
关注一下

【在 Q*******1 的大作中提到】
: 不知道版面发得对不对,就暂时放到job hunting 版吧。
: 先简要介绍一下我的情况,我本科是数学的,修了一些统计的课程多元统计,时间序列
: 分析,计量经济学。现在在美帝东北部一所理工类大学读data science master。 第一
: 个学期学了数据库和统计学习。这个学期打算选big data management(教hadoop
: mapreduce),Data Mining。这两门课都是课量比较大的。
: 其实也不太清楚到底该不该学data mining,因为感觉好多东西都在统计学习那门课都
: 学过了。然后主要是最后一门课就比较纠结了。可选的有回归分析(其实不太想选本科
: 的计量经济学就学的就是回归分析),贝叶斯统计(这个据说在data science领域很有
: 用?),biovisulization(数据可视化的,但是坑爹的是应用于生物数据,听到bio有
: 点反感)。最后就是software system design(软件工程主要用java),因为这门课比

avatar
e*n
10
deing顶

【在 s*******0 的大作中提到】
: machine learning, python,R sas, time series, statistic inference
avatar
T*u
11
我觉着很有用。数据就是钱。能用prior就是省钱。而且有时候好的数据连钱都买不到。

【在 Q*******1 的大作中提到】
: 贝叶斯统计在数据科学领域的有用吗?感觉就本科学概率论的时候学了一点贝叶斯公式
: ,然后根据先验概率求后验概率啊啥的。感觉不知道就这点东西,能够单独成为一门知
: 识呀。

avatar
z*c
12
我就是做这方面的,给你建议是把hadoop mapreduce 学好,data mining 一定要学 而
且要和大数据结合起来学,可以看看现在比较火的spark 和 mahout. software system
design(软件工程主要用java) 这个也要学打好Java 的 coding 基础。你如果这些
都会了并且有做过一些小的project.找工作不成问题
avatar
s*0
13
try probabilistic graphic model
CMU eric xing online courses
我觉着很有用。数据就是钱。能用prior就是省钱。而且有时候好的数据连钱都买不到。

【在 Q*******1 的大作中提到】
: 贝叶斯统计在数据科学领域的有用吗?感觉就本科学概率论的时候学了一点贝叶斯公式
: ,然后根据先验概率求后验概率啊啥的。感觉不知道就这点东西,能够单独成为一门知
: 识呀。

avatar
m*i
14
Useful suggestions.
avatar
j*3
15
mark
avatar
Q*1
16
那还是要刷算法题吧。怎么感觉数据科学家还是和马龙一样学java,刷算法题,除此之
外家了要学python,R, hadoop,data mining, 统计,数据可视化等等一系列的技能
呢?

system

【在 z******c 的大作中提到】
: 我就是做这方面的,给你建议是把hadoop mapreduce 学好,data mining 一定要学 而
: 且要和大数据结合起来学,可以看看现在比较火的spark 和 mahout. software system
: design(软件工程主要用java) 这个也要学打好Java 的 coding 基础。你如果这些
: 都会了并且有做过一些小的project.找工作不成问题

avatar
Q*1
17
除此以外java,算法,数据可视化,自然语言处理,社交网络分析,等等一些列的
skill set吧

【在 s*******0 的大作中提到】
: machine learning, python,R sas, time series, statistic inference
avatar
Q*1
18
这个是什么,我们下个学期倒是有教社交网络中的图什么的课来着。不知道是不是这个
课。

到。

【在 s*******0 的大作中提到】
: try probabilistic graphic model
: CMU eric xing online courses
: 我觉着很有用。数据就是钱。能用prior就是省钱。而且有时候好的数据连钱都买不到。

avatar
Q*1
19
既然这么难,那就还是学门别的可算了,留出时间来学算法,刷算法题。

【在 x******1 的大作中提到】
: Bayes rule 那类很简单了。 bayesian network及其各种衍生模型比较难,跟很多高级
: 模型都有关,建议基础打扎实些。

avatar
z*c
20
算法肯定要会 但是你光会算法,不会用不同的framework写出来也没有什么用。现在最
火的是 大数据和数据挖掘结合的data scientist
Java, C, C#, Matlab 等等都是工具 对于一个data scientist 来说都要会 并且几个
星期之后就能很熟练的使用。 machine learning, data mining, pattern
recognition 实际都是一个概念稍微有些use case的不同。里面很多算法都是通的,一
般工业界要你自己开发新算法的可能性比较小,大多数你只要会用 会改进就可以了。
现在炒的很火的deep learning 实际就是40年前就有的neural network 算法,只不过
因为大数据的平台释放了这些算法的威力 提高了他们的运算量和速度 更提高了精度。

【在 Q*******1 的大作中提到】
: 那还是要刷算法题吧。怎么感觉数据科学家还是和马龙一样学java,刷算法题,除此之
: 外家了要学python,R, hadoop,data mining, 统计,数据可视化等等一系列的技能
: 呢?
:
: system

avatar
Q*1
21
不好意思,我没说清楚,我的意思是指算法与数据结构那种算法,不是说自己写机器学
习的算法。那个也太难了点了。所以面试数据科学家应该都会考算法,然后也会有小白
板吧?



【在 z******c 的大作中提到】
: 算法肯定要会 但是你光会算法,不会用不同的framework写出来也没有什么用。现在最
: 火的是 大数据和数据挖掘结合的data scientist
: Java, C, C#, Matlab 等等都是工具 对于一个data scientist 来说都要会 并且几个
: 星期之后就能很熟练的使用。 machine learning, data mining, pattern
: recognition 实际都是一个概念稍微有些use case的不同。里面很多算法都是通的,一
: 般工业界要你自己开发新算法的可能性比较小,大多数你只要会用 会改进就可以了。
: 现在炒的很火的deep learning 实际就是40年前就有的neural network 算法,只不过
: 因为大数据的平台释放了这些算法的威力 提高了他们的运算量和速度 更提高了精度。

avatar
D*r
22
要考,但是比面试软工的简单

【在 Q*******1 的大作中提到】
: 不好意思,我没说清楚,我的意思是指算法与数据结构那种算法,不是说自己写机器学
: 习的算法。那个也太难了点了。所以面试数据科学家应该都会考算法,然后也会有小白
: 板吧?
:
: 。

avatar
Q*1
23
能不能问下大神,面数据科学家,算法方面该怎么准备呀。我知道面软工的话是只要刷
Lectcode就可以了。

【在 D***r 的大作中提到】
: 要考,但是比面试软工的简单
avatar
D*r
24
也就是软工那些题挑一些不太难的吧
比如我碰到过给一个字符串,找出左右对称的所有子串,然后分析算法的复杂度
都是很简单的题

【在 Q*******1 的大作中提到】
: 能不能问下大神,面数据科学家,算法方面该怎么准备呀。我知道面软工的话是只要刷
: Lectcode就可以了。

avatar
h*8
25
mark
avatar
Q*1
26
不知道版面发得对不对,就暂时放到job hunting 版吧。
先简要介绍一下我的情况,我本科是数学的,修了一些统计的课程多元统计,时间序列
分析,计量经济学。现在在美帝东北部一所理工类大学读data science master。 第一
个学期学了数据库和统计学习。这个学期打算选big data management(教hadoop
mapreduce),Data Mining。这两门课都是课量比较大的。
其实也不太清楚到底该不该学data mining,因为感觉好多东西都在统计学习那门课都
学过了。然后主要是最后一门课就比较纠结了。可选的有回归分析(其实不太想选本科
的计量经济学就学的就是回归分析),贝叶斯统计(这个据说在data science领域很有
用?),biovisulization(数据可视化的,但是坑爹的是应用于生物数据,听到bio有
点反感)。最后就是software system design(软件工程主要用java),因为这门课比
较popular,各种专业的人抢着来上这门课,所以我现在暂时是占着这个坑的。
最后这门课要求的coding比较多,根据同学们反映这门课也能够学到很多东西,很门很
有含金量课。选这门课也是为了熟练一下java编程。问题是这门课比较demanding,如
果真的选了这门课就估计没什么时间再跟网上的算法公开课了,也更加没时间刷算法题
了准备暑期实习了(貌似找data scientist工作也要刷题?)。 而且就和data
science的相关性来看,这门课好像和数据科学没多大的关系。
所以最后很是纠结到底选那门课比较好。求版上的大神们给点建议哈。谢谢了。
avatar
E*F
27
东西当然是会得越多越好
不过如果你想当data scientist的话,software design没太大用,面试也不会考
你如果以前对贝叶斯不太了解的,应该学一下
这个名字下有很多不同的内容,比如有的只是在回归的基础上加上prior
有的则是搞出贝叶斯网络,马科夫网络啥的,跟传统统计差别很大

【在 Q*******1 的大作中提到】
: 不知道版面发得对不对,就暂时放到job hunting 版吧。
: 先简要介绍一下我的情况,我本科是数学的,修了一些统计的课程多元统计,时间序列
: 分析,计量经济学。现在在美帝东北部一所理工类大学读data science master。 第一
: 个学期学了数据库和统计学习。这个学期打算选big data management(教hadoop
: mapreduce),Data Mining。这两门课都是课量比较大的。
: 其实也不太清楚到底该不该学data mining,因为感觉好多东西都在统计学习那门课都
: 学过了。然后主要是最后一门课就比较纠结了。可选的有回归分析(其实不太想选本科
: 的计量经济学就学的就是回归分析),贝叶斯统计(这个据说在data science领域很有
: 用?),biovisulization(数据可视化的,但是坑爹的是应用于生物数据,听到bio有
: 点反感)。最后就是software system design(软件工程主要用java),因为这门课比

avatar
Q*1
28
贝叶斯统计在数据科学领域的有用吗?感觉就本科学概率论的时候学了一点贝叶斯公式
,然后根据先验概率求后验概率啊啥的。感觉不知道就这点东西,能够单独成为一门知
识呀。

【在 E*******F 的大作中提到】
: 东西当然是会得越多越好
: 不过如果你想当data scientist的话,software design没太大用,面试也不会考
: 你如果以前对贝叶斯不太了解的,应该学一下
: 这个名字下有很多不同的内容,比如有的只是在回归的基础上加上prior
: 有的则是搞出贝叶斯网络,马科夫网络啥的,跟传统统计差别很大

avatar
E*F
29
本科概率课上的例子大概都是一维的情况吧
如果是高维数据,贝叶斯统计可以变得很复杂
比如这样一个应用:
考试成绩和志愿共同决定录取结果(概率意义上的),
录取结果和身高决定毕业工资
身高和工资又共同决定老婆水平
这些都给你一些数据去算条件概率
下面求考试成绩为600分,身高160cm时,娶到凤姐的边缘概率是多大
再求已知娶到凤姐时,当初录取到北大生物系的概率
这个本科那种例子大概就搞不定了

【在 Q*******1 的大作中提到】
: 贝叶斯统计在数据科学领域的有用吗?感觉就本科学概率论的时候学了一点贝叶斯公式
: ,然后根据先验概率求后验概率啊啥的。感觉不知道就这点东西,能够单独成为一门知
: 识呀。

avatar
Q*1
30
那贝叶斯统计会在面试中问吗?
avatar
s*0
31
machine learning, python,R sas, time series, statistic inference
avatar
e*s
32
谁会问这种1+1地问题...

【在 Q*******1 的大作中提到】
: 那贝叶斯统计会在面试中问吗?
avatar
x*1
33
Bayes rule 那类很简单了。 bayesian network及其各种衍生模型比较难,跟很多高级
模型都有关,建议基础打扎实些。

【在 Q*******1 的大作中提到】
: 那贝叶斯统计会在面试中问吗?
avatar
W*o
34
关注一下

【在 Q*******1 的大作中提到】
: 不知道版面发得对不对,就暂时放到job hunting 版吧。
: 先简要介绍一下我的情况,我本科是数学的,修了一些统计的课程多元统计,时间序列
: 分析,计量经济学。现在在美帝东北部一所理工类大学读data science master。 第一
: 个学期学了数据库和统计学习。这个学期打算选big data management(教hadoop
: mapreduce),Data Mining。这两门课都是课量比较大的。
: 其实也不太清楚到底该不该学data mining,因为感觉好多东西都在统计学习那门课都
: 学过了。然后主要是最后一门课就比较纠结了。可选的有回归分析(其实不太想选本科
: 的计量经济学就学的就是回归分析),贝叶斯统计(这个据说在data science领域很有
: 用?),biovisulization(数据可视化的,但是坑爹的是应用于生物数据,听到bio有
: 点反感)。最后就是software system design(软件工程主要用java),因为这门课比

avatar
e*n
35
deing顶

【在 s*******0 的大作中提到】
: machine learning, python,R sas, time series, statistic inference
avatar
T*u
36
我觉着很有用。数据就是钱。能用prior就是省钱。而且有时候好的数据连钱都买不到。

【在 Q*******1 的大作中提到】
: 贝叶斯统计在数据科学领域的有用吗?感觉就本科学概率论的时候学了一点贝叶斯公式
: ,然后根据先验概率求后验概率啊啥的。感觉不知道就这点东西,能够单独成为一门知
: 识呀。

avatar
z*c
37
我就是做这方面的,给你建议是把hadoop mapreduce 学好,data mining 一定要学 而
且要和大数据结合起来学,可以看看现在比较火的spark 和 mahout. software system
design(软件工程主要用java) 这个也要学打好Java 的 coding 基础。你如果这些
都会了并且有做过一些小的project.找工作不成问题
avatar
s*0
38
try probabilistic graphic model
CMU eric xing online courses
我觉着很有用。数据就是钱。能用prior就是省钱。而且有时候好的数据连钱都买不到。

【在 Q*******1 的大作中提到】
: 贝叶斯统计在数据科学领域的有用吗?感觉就本科学概率论的时候学了一点贝叶斯公式
: ,然后根据先验概率求后验概率啊啥的。感觉不知道就这点东西,能够单独成为一门知
: 识呀。

avatar
m*i
39
Useful suggestions.
avatar
j*3
40
mark
avatar
Q*1
41
那还是要刷算法题吧。怎么感觉数据科学家还是和马龙一样学java,刷算法题,除此之
外家了要学python,R, hadoop,data mining, 统计,数据可视化等等一系列的技能
呢?

system

【在 z******c 的大作中提到】
: 我就是做这方面的,给你建议是把hadoop mapreduce 学好,data mining 一定要学 而
: 且要和大数据结合起来学,可以看看现在比较火的spark 和 mahout. software system
: design(软件工程主要用java) 这个也要学打好Java 的 coding 基础。你如果这些
: 都会了并且有做过一些小的project.找工作不成问题

avatar
Q*1
42
除此以外java,算法,数据可视化,自然语言处理,社交网络分析,等等一些列的
skill set吧

【在 s*******0 的大作中提到】
: machine learning, python,R sas, time series, statistic inference
avatar
Q*1
43
这个是什么,我们下个学期倒是有教社交网络中的图什么的课来着。不知道是不是这个
课。

到。

【在 s*******0 的大作中提到】
: try probabilistic graphic model
: CMU eric xing online courses
: 我觉着很有用。数据就是钱。能用prior就是省钱。而且有时候好的数据连钱都买不到。

avatar
Q*1
44
既然这么难,那就还是学门别的可算了,留出时间来学算法,刷算法题。

【在 x******1 的大作中提到】
: Bayes rule 那类很简单了。 bayesian network及其各种衍生模型比较难,跟很多高级
: 模型都有关,建议基础打扎实些。

avatar
z*c
45
算法肯定要会 但是你光会算法,不会用不同的framework写出来也没有什么用。现在最
火的是 大数据和数据挖掘结合的data scientist
Java, C, C#, Matlab 等等都是工具 对于一个data scientist 来说都要会 并且几个
星期之后就能很熟练的使用。 machine learning, data mining, pattern
recognition 实际都是一个概念稍微有些use case的不同。里面很多算法都是通的,一
般工业界要你自己开发新算法的可能性比较小,大多数你只要会用 会改进就可以了。
现在炒的很火的deep learning 实际就是40年前就有的neural network 算法,只不过
因为大数据的平台释放了这些算法的威力 提高了他们的运算量和速度 更提高了精度。

【在 Q*******1 的大作中提到】
: 那还是要刷算法题吧。怎么感觉数据科学家还是和马龙一样学java,刷算法题,除此之
: 外家了要学python,R, hadoop,data mining, 统计,数据可视化等等一系列的技能
: 呢?
:
: system

avatar
Q*1
46
不好意思,我没说清楚,我的意思是指算法与数据结构那种算法,不是说自己写机器学
习的算法。那个也太难了点了。所以面试数据科学家应该都会考算法,然后也会有小白
板吧?



【在 z******c 的大作中提到】
: 算法肯定要会 但是你光会算法,不会用不同的framework写出来也没有什么用。现在最
: 火的是 大数据和数据挖掘结合的data scientist
: Java, C, C#, Matlab 等等都是工具 对于一个data scientist 来说都要会 并且几个
: 星期之后就能很熟练的使用。 machine learning, data mining, pattern
: recognition 实际都是一个概念稍微有些use case的不同。里面很多算法都是通的,一
: 般工业界要你自己开发新算法的可能性比较小,大多数你只要会用 会改进就可以了。
: 现在炒的很火的deep learning 实际就是40年前就有的neural network 算法,只不过
: 因为大数据的平台释放了这些算法的威力 提高了他们的运算量和速度 更提高了精度。

avatar
D*r
47
要考,但是比面试软工的简单

【在 Q*******1 的大作中提到】
: 不好意思,我没说清楚,我的意思是指算法与数据结构那种算法,不是说自己写机器学
: 习的算法。那个也太难了点了。所以面试数据科学家应该都会考算法,然后也会有小白
: 板吧?
:
: 。

avatar
Q*1
48
能不能问下大神,面数据科学家,算法方面该怎么准备呀。我知道面软工的话是只要刷
Lectcode就可以了。

【在 D***r 的大作中提到】
: 要考,但是比面试软工的简单
avatar
D*r
49
也就是软工那些题挑一些不太难的吧
比如我碰到过给一个字符串,找出左右对称的所有子串,然后分析算法的复杂度
都是很简单的题

【在 Q*******1 的大作中提到】
: 能不能问下大神,面数据科学家,算法方面该怎么准备呀。我知道面软工的话是只要刷
: Lectcode就可以了。

avatar
h*8
50
mark
avatar
Q*1
51
大神,不好意思又要来问你了。这个学期听从你意见学了软件工程。果然大大的锻炼了
java技能。第一次写了好几千行代码,编了一个网站出来了。
现在又要来征求下前辈的建议了。我现在暑假有个机会是和老师一起做研究,修改
hadoop的源码。但是原本是打算选门computer networks的。要是和老师改源代码的话
,我最后3个可以自由支配,用来选cs基础核心课程的学分就没了。不知道前辈觉得我
去改源码好还是选networks?选cs的课是为了多一个选择,怕以后当不了数据科学家,
就去找软工的工作去。我隐隐觉得还是cs是王道,ds工作没cs百分之一多。
感激不尽。

【在 D***r 的大作中提到】
: 也就是软工那些题挑一些不太难的吧
: 比如我碰到过给一个字符串,找出左右对称的所有子串,然后分析算法的复杂度
: 都是很简单的题

avatar
c*z
52
贝叶斯统计相当于九阴真经

【在 Q*******1 的大作中提到】
: 贝叶斯统计在数据科学领域的有用吗?感觉就本科学概率论的时候学了一点贝叶斯公式
: ,然后根据先验概率求后验概率啊啥的。感觉不知道就这点东西,能够单独成为一门知
: 识呀。

avatar
h*3
53
1. 选big data management,不要选data mining。单单读个master的一门data mining
课,根本不可能让你未来从事这方面的工作,反而会让你浪费很多时间。现在如果真的
需要做data mining, machine learning的职位,CS PHD优势太大了,别人光一篇KDD或
者ICML,就可以override你在这方面所有的经历和知识。hadoop方面,毕
竟偏重于工程,实际当中无论如何都是用得到得。像bayesian inference,都是十分前
沿的方法,很多phd都搞不来呢。
2. software system design绝对要选。任何关于coding的课程其实都应该选。群众的
眼睛是雪亮的。这么多人都抢这门课,就是这个道理。
3. 尽量不要把自己定位到data scientist。其实现在没有有真正的data scientist职
位,顶多就是data analyst,普通商科学生都可以做。你基础不错,应该把自己定位更
高一点,应该把职业方向向software engineer靠,未来的职业发展,薪酬都会更好一
些。

【在 Q*******1 的大作中提到】
: 不知道版面发得对不对,就暂时放到job hunting 版吧。
: 先简要介绍一下我的情况,我本科是数学的,修了一些统计的课程多元统计,时间序列
: 分析,计量经济学。现在在美帝东北部一所理工类大学读data science master。 第一
: 个学期学了数据库和统计学习。这个学期打算选big data management(教hadoop
: mapreduce),Data Mining。这两门课都是课量比较大的。
: 其实也不太清楚到底该不该学data mining,因为感觉好多东西都在统计学习那门课都
: 学过了。然后主要是最后一门课就比较纠结了。可选的有回归分析(其实不太想选本科
: 的计量经济学就学的就是回归分析),贝叶斯统计(这个据说在data science领域很有
: 用?),biovisulization(数据可视化的,但是坑爹的是应用于生物数据,听到bio有
: 点反感)。最后就是software system design(软件工程主要用java),因为这门课比

avatar
f*k
54
这例子太赞了…

【在 E*******F 的大作中提到】
: 本科概率课上的例子大概都是一维的情况吧
: 如果是高维数据,贝叶斯统计可以变得很复杂
: 比如这样一个应用:
: 考试成绩和志愿共同决定录取结果(概率意义上的),
: 录取结果和身高决定毕业工资
: 身高和工资又共同决定老婆水平
: 这些都给你一些数据去算条件概率
: 下面求考试成绩为600分,身高160cm时,娶到凤姐的边缘概率是多大
: 再求已知娶到凤姐时,当初录取到北大生物系的概率
: 这个本科那种例子大概就搞不定了

avatar
Q*1
55
多谢大神回答。要是早点看到大神的回复就好了。这个学期选了data mining真是感觉
吃亏不讨好。害我没找到实习。也确实感觉到machine learning之类的岗位bar有点高。
那前辈看看我该找cs的哪方面的工作呢?前端的话javascript,html,jsp之类的不懂
,其他计算机知识,像网络,操作系统的课也没有学过。目前简历上面就只有hadoop,
machine learning, java web方面的课堂project。打算暑假刷下算法题,然后跟老师
做研究改hadoop源码。
我是怕我懂cs的知识太少了,找不到SDE的工作。

mining

【在 h********3 的大作中提到】
: 1. 选big data management,不要选data mining。单单读个master的一门data mining
: 课,根本不可能让你未来从事这方面的工作,反而会让你浪费很多时间。现在如果真的
: 需要做data mining, machine learning的职位,CS PHD优势太大了,别人光一篇KDD或
: 者ICML,就可以override你在这方面所有的经历和知识。hadoop方面,毕
: 竟偏重于工程,实际当中无论如何都是用得到得。像bayesian inference,都是十分前
: 沿的方法,很多phd都搞不来呢。
: 2. software system design绝对要选。任何关于coding的课程其实都应该选。群众的
: 眼睛是雪亮的。这么多人都抢这门课,就是这个道理。
: 3. 尽量不要把自己定位到data scientist。其实现在没有有真正的data scientist职
: 位,顶多就是data analyst,普通商科学生都可以做。你基础不错,应该把自己定位更

avatar
m*g
56
这个例子太好了!

【在 E*******F 的大作中提到】
: 本科概率课上的例子大概都是一维的情况吧
: 如果是高维数据,贝叶斯统计可以变得很复杂
: 比如这样一个应用:
: 考试成绩和志愿共同决定录取结果(概率意义上的),
: 录取结果和身高决定毕业工资
: 身高和工资又共同决定老婆水平
: 这些都给你一些数据去算条件概率
: 下面求考试成绩为600分,身高160cm时,娶到凤姐的边缘概率是多大
: 再求已知娶到凤姐时,当初录取到北大生物系的概率
: 这个本科那种例子大概就搞不定了

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。