n*e
2 楼
不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
数人跳坑。究其原因无非是以下几点。
1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
商是硬通货,脑力不够用而避重就轻,输在起点上了。
2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
大数据系统经验的码工包裹很高。
3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
andrew ng那种吗?不是那你high个屁。
4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
业务部门呼来喝去的shared services。
5. 感觉这样的核心职位应该工资更高。数据统计表明,data职位在工资,职位数量,
职业发展都远远不如码工。职位都没几个,发展个毛呢?
其实要找到好的data的职位,还是得靠码工的技能,这个是无法回避的。烙印就不趟这
个浑水,集中精力一门心思做码工。大家最好还是醒醒,认清现实,向烙印学习。
数人跳坑。究其原因无非是以下几点。
1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
商是硬通货,脑力不够用而避重就轻,输在起点上了。
2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
大数据系统经验的码工包裹很高。
3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
andrew ng那种吗?不是那你high个屁。
4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
业务部门呼来喝去的shared services。
5. 感觉这样的核心职位应该工资更高。数据统计表明,data职位在工资,职位数量,
职业发展都远远不如码工。职位都没几个,发展个毛呢?
其实要找到好的data的职位,还是得靠码工的技能,这个是无法回避的。烙印就不趟这
个浑水,集中精力一门心思做码工。大家最好还是醒醒,认清现实,向烙印学习。
c*n
3 楼
同意
data这块很多是培训机构吹起来啊的 就我观察 岗位和收入都不如纯码工
data这块很多是培训机构吹起来啊的 就我观察 岗位和收入都不如纯码工
s*r
4 楼
做data有一点好,技术和理论万年不变,工作非常稳定,只要公司还在运转,就需要做
data的,适合老同志和有娃大妈去养老
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
data的,适合老同志和有娃大妈去养老
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
k*n
6 楼
我同意楼主的观点。
t*n
8 楼
有理
牛逼哥一席话,如同淫水灌顶
两年前差点转去做data科学家了。辛亏坚持做码农
牛逼哥一席话,如同淫水灌顶
两年前差点转去做data科学家了。辛亏坚持做码农
b*n
9 楼
DBA就是大妈职位。
r*7
10 楼
码工如果做infra还能慢慢积累知识,如果就是开发各种feature,不管是前端还是后端
,就是一个劲的写写写,3年工作经验和10年工作经验没有毛线差别。
infra的话,目前有点像硬件,变化已经不多了不说,极有可能被几家大公司垄断,其
他人都用cloud service。垄断是好是坏,参考做CPU的硬工,不要说做CPU没有技术含
量。
data目前是个变化很快的领域,各种新的architecture用于解决各种不同的问题,而且
做data的人码的也是很好的,Jeff Dean从某种意义上讲就算马工转data啊。另外可以
看看机器学习的大牛里边,老中特别是年轻老中的比例,是很高的。之所以这样就是因
为新东西多,你先做了就是这个领域的大牛。
马工目前不拥抱这个变化,5年后就像现在硬工看马工的大包裹一样,去看data的大包裹
.事实已经发生了,做computer vision的大牛包裹轻松是标准包裹的3、4倍
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
,就是一个劲的写写写,3年工作经验和10年工作经验没有毛线差别。
infra的话,目前有点像硬件,变化已经不多了不说,极有可能被几家大公司垄断,其
他人都用cloud service。垄断是好是坏,参考做CPU的硬工,不要说做CPU没有技术含
量。
data目前是个变化很快的领域,各种新的architecture用于解决各种不同的问题,而且
做data的人码的也是很好的,Jeff Dean从某种意义上讲就算马工转data啊。另外可以
看看机器学习的大牛里边,老中特别是年轻老中的比例,是很高的。之所以这样就是因
为新东西多,你先做了就是这个领域的大牛。
马工目前不拥抱这个变化,5年后就像现在硬工看马工的大包裹一样,去看data的大包裹
.事实已经发生了,做computer vision的大牛包裹轻松是标准包裹的3、4倍
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
t*n
11 楼
computer vision年包裹一米?靠,要转行
【在 r****7 的大作中提到】
: 码工如果做infra还能慢慢积累知识,如果就是开发各种feature,不管是前端还是后端
: ,就是一个劲的写写写,3年工作经验和10年工作经验没有毛线差别。
: infra的话,目前有点像硬件,变化已经不多了不说,极有可能被几家大公司垄断,其
: 他人都用cloud service。垄断是好是坏,参考做CPU的硬工,不要说做CPU没有技术含
: 量。
: data目前是个变化很快的领域,各种新的architecture用于解决各种不同的问题,而且
: 做data的人码的也是很好的,Jeff Dean从某种意义上讲就算马工转data啊。另外可以
: 看看机器学习的大牛里边,老中特别是年轻老中的比例,是很高的。之所以这样就是因
: 为新东西多,你先做了就是这个领域的大牛。
: 马工目前不拥抱这个变化,5年后就像现在硬工看马工的大包裹一样,去看data的大包裹
【在 r****7 的大作中提到】
: 码工如果做infra还能慢慢积累知识,如果就是开发各种feature,不管是前端还是后端
: ,就是一个劲的写写写,3年工作经验和10年工作经验没有毛线差别。
: infra的话,目前有点像硬件,变化已经不多了不说,极有可能被几家大公司垄断,其
: 他人都用cloud service。垄断是好是坏,参考做CPU的硬工,不要说做CPU没有技术含
: 量。
: data目前是个变化很快的领域,各种新的architecture用于解决各种不同的问题,而且
: 做data的人码的也是很好的,Jeff Dean从某种意义上讲就算马工转data啊。另外可以
: 看看机器学习的大牛里边,老中特别是年轻老中的比例,是很高的。之所以这样就是因
: 为新东西多,你先做了就是这个领域的大牛。
: 马工目前不拥抱这个变化,5年后就像现在硬工看马工的大包裹一样,去看data的大包裹
n*e
12 楼
一团浆糊的逻辑和统计常识,这样的人是怎样混到data职位的呢?难道是被同样头脑不
清楚的人面试的吗?
【在 r****7 的大作中提到】
: 码工如果做infra还能慢慢积累知识,如果就是开发各种feature,不管是前端还是后端
: ,就是一个劲的写写写,3年工作经验和10年工作经验没有毛线差别。
: infra的话,目前有点像硬件,变化已经不多了不说,极有可能被几家大公司垄断,其
: 他人都用cloud service。垄断是好是坏,参考做CPU的硬工,不要说做CPU没有技术含
: 量。
: data目前是个变化很快的领域,各种新的architecture用于解决各种不同的问题,而且
: 做data的人码的也是很好的,Jeff Dean从某种意义上讲就算马工转data啊。另外可以
: 看看机器学习的大牛里边,老中特别是年轻老中的比例,是很高的。之所以这样就是因
: 为新东西多,你先做了就是这个领域的大牛。
: 马工目前不拥抱这个变化,5年后就像现在硬工看马工的大包裹一样,去看data的大包裹
清楚的人面试的吗?
【在 r****7 的大作中提到】
: 码工如果做infra还能慢慢积累知识,如果就是开发各种feature,不管是前端还是后端
: ,就是一个劲的写写写,3年工作经验和10年工作经验没有毛线差别。
: infra的话,目前有点像硬件,变化已经不多了不说,极有可能被几家大公司垄断,其
: 他人都用cloud service。垄断是好是坏,参考做CPU的硬工,不要说做CPU没有技术含
: 量。
: data目前是个变化很快的领域,各种新的architecture用于解决各种不同的问题,而且
: 做data的人码的也是很好的,Jeff Dean从某种意义上讲就算马工转data啊。另外可以
: 看看机器学习的大牛里边,老中特别是年轻老中的比例,是很高的。之所以这样就是因
: 为新东西多,你先做了就是这个领域的大牛。
: 马工目前不拥抱这个变化,5年后就像现在硬工看马工的大包裹一样,去看data的大包裹
a*2
15 楼
我觉得lz说的比较片面,如果光做码农,在工作中能学到的东西真的很少,大部分都是
在code business logic,因为公司不会让码农花大部分时间去搞新东西,觉得可行了
,才会花人力,物力去做,所以大家才把software engineer叫做码农,因为基本上不
用思考,就是用已有的tool, infra去实现各种features
但是我觉的楼主有一点说的挺对,那种只做模型的,很危险,
我觉的现在大家要成为能deliver end2end solution那种hybrid model的人, 能做
prototype/poc, production development, equality engineering, 到最后statistic
test of feature importance.
但如果想成为这类人,原来做data的绝对比码农好转,因为machine learning 从熟悉
到能在工作中用的时间绝对是 了解使用大数据工具时间 的两倍以上
在code business logic,因为公司不会让码农花大部分时间去搞新东西,觉得可行了
,才会花人力,物力去做,所以大家才把software engineer叫做码农,因为基本上不
用思考,就是用已有的tool, infra去实现各种features
但是我觉的楼主有一点说的挺对,那种只做模型的,很危险,
我觉的现在大家要成为能deliver end2end solution那种hybrid model的人, 能做
prototype/poc, production development, equality engineering, 到最后statistic
test of feature importance.
但如果想成为这类人,原来做data的绝对比码农好转,因为machine learning 从熟悉
到能在工作中用的时间绝对是 了解使用大数据工具时间 的两倍以上
n*e
16 楼
你的回复看起来很外行。
statistic
【在 a*****2 的大作中提到】
: 我觉得lz说的比较片面,如果光做码农,在工作中能学到的东西真的很少,大部分都是
: 在code business logic,因为公司不会让码农花大部分时间去搞新东西,觉得可行了
: ,才会花人力,物力去做,所以大家才把software engineer叫做码农,因为基本上不
: 用思考,就是用已有的tool, infra去实现各种features
: 但是我觉的楼主有一点说的挺对,那种只做模型的,很危险,
: 我觉的现在大家要成为能deliver end2end solution那种hybrid model的人, 能做
: prototype/poc, production development, equality engineering, 到最后statistic
: test of feature importance.
: 但如果想成为这类人,原来做data的绝对比码农好转,因为machine learning 从熟悉
: 到能在工作中用的时间绝对是 了解使用大数据工具时间 的两倍以上
statistic
【在 a*****2 的大作中提到】
: 我觉得lz说的比较片面,如果光做码农,在工作中能学到的东西真的很少,大部分都是
: 在code business logic,因为公司不会让码农花大部分时间去搞新东西,觉得可行了
: ,才会花人力,物力去做,所以大家才把software engineer叫做码农,因为基本上不
: 用思考,就是用已有的tool, infra去实现各种features
: 但是我觉的楼主有一点说的挺对,那种只做模型的,很危险,
: 我觉的现在大家要成为能deliver end2end solution那种hybrid model的人, 能做
: prototype/poc, production development, equality engineering, 到最后statistic
: test of feature importance.
: 但如果想成为这类人,原来做data的绝对比码农好转,因为machine learning 从熟悉
: 到能在工作中用的时间绝对是 了解使用大数据工具时间 的两倍以上
w*m
18 楼
同意牛逼哥
title前面加data
钱少1/3
title前面加data
钱少1/3
s*r
21 楼
嗯,只会用现成轮子做business logic的确实技术含量不高,无非是J2EE,Spring,网
页,Mobile这些。
后台比前台好一些,也好的不多,职业稳定性远不如做data,而且这行越老越吃力,因
为门槛低,可以不要求经验,年轻人上手快,干劲组,码code能力强,老码农的日子不
好过
statistic
【在 a*****2 的大作中提到】
: 我觉得lz说的比较片面,如果光做码农,在工作中能学到的东西真的很少,大部分都是
: 在code business logic,因为公司不会让码农花大部分时间去搞新东西,觉得可行了
: ,才会花人力,物力去做,所以大家才把software engineer叫做码农,因为基本上不
: 用思考,就是用已有的tool, infra去实现各种features
: 但是我觉的楼主有一点说的挺对,那种只做模型的,很危险,
: 我觉的现在大家要成为能deliver end2end solution那种hybrid model的人, 能做
: prototype/poc, production development, equality engineering, 到最后statistic
: test of feature importance.
: 但如果想成为这类人,原来做data的绝对比码农好转,因为machine learning 从熟悉
: 到能在工作中用的时间绝对是 了解使用大数据工具时间 的两倍以上
页,Mobile这些。
后台比前台好一些,也好的不多,职业稳定性远不如做data,而且这行越老越吃力,因
为门槛低,可以不要求经验,年轻人上手快,干劲组,码code能力强,老码农的日子不
好过
statistic
【在 a*****2 的大作中提到】
: 我觉得lz说的比较片面,如果光做码农,在工作中能学到的东西真的很少,大部分都是
: 在code business logic,因为公司不会让码农花大部分时间去搞新东西,觉得可行了
: ,才会花人力,物力去做,所以大家才把software engineer叫做码农,因为基本上不
: 用思考,就是用已有的tool, infra去实现各种features
: 但是我觉的楼主有一点说的挺对,那种只做模型的,很危险,
: 我觉的现在大家要成为能deliver end2end solution那种hybrid model的人, 能做
: prototype/poc, production development, equality engineering, 到最后statistic
: test of feature importance.
: 但如果想成为这类人,原来做data的绝对比码农好转,因为machine learning 从熟悉
: 到能在工作中用的时间绝对是 了解使用大数据工具时间 的两倍以上
a*s
22 楼
在IT行业里面,变化慢的东西,就容易被计算机取代,这个是趋势,因为CS这个行业本
身是通过加速其他行业的进化而生存的。那么,需要积累何记忆的不变的东西,计算机
也会,就不需要你了。而变化快的东西,计算机没法适应,才需要人类的参与。
身是通过加速其他行业的进化而生存的。那么,需要积累何记忆的不变的东西,计算机
也会,就不需要你了。而变化快的东西,计算机没法适应,才需要人类的参与。
a*g
23 楼
码工很多种的,遍专业软件的呢
a*e
25 楼
https://en.wikipedia.org/wiki/Affinity_propagation
http://scikit-learn.org/stable/auto_examples/cluster/plot_affinity_propagation.html
Affinity Propagation. 都出来对应的python 包了。idea 最早10年左右前就出来了吧
。可能还有别的方法。
【在 S******t 的大作中提到】
: 请问这个能给出number of clusters的是什么算法?
:
: 。
http://scikit-learn.org/stable/auto_examples/cluster/plot_affinity_propagation.html
Affinity Propagation. 都出来对应的python 包了。idea 最早10年左右前就出来了吧
。可能还有别的方法。
【在 S******t 的大作中提到】
: 请问这个能给出number of clusters的是什么算法?
:
: 。
l*r
26 楼
data scientist名称比码农高大上所以好多刚毕业或者没有编程基础的都去做。
结果可能都找不到工作?毕竟“科学家”也不是谁都能做的。
我理解data是码农提升技能的途径
结果可能都找不到工作?毕竟“科学家”也不是谁都能做的。
我理解data是码农提升技能的途径
r*r
27 楼
年纪大了程序写不动了,在公司混日子等退休,做这个也挺好,反正工资也不降
f*r
28 楼
其实都是冰山效应,码工也好,data也好,风光的都是金字塔顶上的那一块。但是现在
码工整体这块蛋糕比data和其他类似的传统行业大得多,所以码工的大包裹貌似远超
data。做职业规划除了看整体蛋糕大小,还要看长期发展,码工长期看还是偏青春饭,
走上管理track的凤毛麟角,更别提还有阿三打压。data相关工作长期看更适合养老,
技术进化慢,主要是大企业技术更新慢,所以经验没那么容易过时。相反码工的
framework和新语言层出不穷,特别是互联网相关的,这个和新的应用是相辅相成的,
好处是机会多,有点子就可以快速创业,缺点是山头太多跟不过来,所谓成也萧何败也
萧何。
个人觉得年轻人刚毕业的或者转行的,码工还是最佳选择。但是上了年纪拖家带口刷题
搞不动了的,但是又有统计之类的背景,比如ee,千老出身的,转行去data可能更合适
码工整体这块蛋糕比data和其他类似的传统行业大得多,所以码工的大包裹貌似远超
data。做职业规划除了看整体蛋糕大小,还要看长期发展,码工长期看还是偏青春饭,
走上管理track的凤毛麟角,更别提还有阿三打压。data相关工作长期看更适合养老,
技术进化慢,主要是大企业技术更新慢,所以经验没那么容易过时。相反码工的
framework和新语言层出不穷,特别是互联网相关的,这个和新的应用是相辅相成的,
好处是机会多,有点子就可以快速创业,缺点是山头太多跟不过来,所谓成也萧何败也
萧何。
个人觉得年轻人刚毕业的或者转行的,码工还是最佳选择。但是上了年纪拖家带口刷题
搞不动了的,但是又有统计之类的背景,比如ee,千老出身的,转行去data可能更合适
c*1
29 楼
我反而觉得学Data难,拐七拐八的难理解,编程对我相对容易些。
b*y
30 楼
主要data面试没办法刷题,难度大很多
S*r
31 楼
说得很实在,也很在理
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
a*e
32 楼
你说的正是我一直所想的。data 面试没法刷题,而且可以考的东西很多,统计一个学
科学完硕士就有十几,几十个 subject. 面试的时候,简历上的东西准备的时候还有个
头绪,应对,而对于面试官要问的那些random problem solving 的问题,真的只有碰
运气,你面试前如果凑巧看了,那还算好,如果没看到,那就... 除了那些数学统计基
础超好,经过n 年幸苦的人面试起来不是很累,一般人提前一年准备都汗。而且现在有
些公司还喜欢结合他们的产品出些面试题,那就更糊涂,然后还有面试 pop quiz, 面
试概率题,n 多。一门概率论要认真复习起来不得几个月?
倒是我后来看了计算机的面试,可以刷题,可控制性高很多。
【在 b******y 的大作中提到】
: 主要data面试没办法刷题,难度大很多
科学完硕士就有十几,几十个 subject. 面试的时候,简历上的东西准备的时候还有个
头绪,应对,而对于面试官要问的那些random problem solving 的问题,真的只有碰
运气,你面试前如果凑巧看了,那还算好,如果没看到,那就... 除了那些数学统计基
础超好,经过n 年幸苦的人面试起来不是很累,一般人提前一年准备都汗。而且现在有
些公司还喜欢结合他们的产品出些面试题,那就更糊涂,然后还有面试 pop quiz, 面
试概率题,n 多。一门概率论要认真复习起来不得几个月?
倒是我后来看了计算机的面试,可以刷题,可控制性高很多。
【在 b******y 的大作中提到】
: 主要data面试没办法刷题,难度大很多
L*9
33 楼
有道理
【在 a*****e 的大作中提到】
: 你说的正是我一直所想的。data 面试没法刷题,而且可以考的东西很多,统计一个学
: 科学完硕士就有十几,几十个 subject. 面试的时候,简历上的东西准备的时候还有个
: 头绪,应对,而对于面试官要问的那些random problem solving 的问题,真的只有碰
: 运气,你面试前如果凑巧看了,那还算好,如果没看到,那就... 除了那些数学统计基
: 础超好,经过n 年幸苦的人面试起来不是很累,一般人提前一年准备都汗。而且现在有
: 些公司还喜欢结合他们的产品出些面试题,那就更糊涂,然后还有面试 pop quiz, 面
: 试概率题,n 多。一门概率论要认真复习起来不得几个月?
: 倒是我后来看了计算机的面试,可以刷题,可控制性高很多。
【在 a*****e 的大作中提到】
: 你说的正是我一直所想的。data 面试没法刷题,而且可以考的东西很多,统计一个学
: 科学完硕士就有十几,几十个 subject. 面试的时候,简历上的东西准备的时候还有个
: 头绪,应对,而对于面试官要问的那些random problem solving 的问题,真的只有碰
: 运气,你面试前如果凑巧看了,那还算好,如果没看到,那就... 除了那些数学统计基
: 础超好,经过n 年幸苦的人面试起来不是很累,一般人提前一年准备都汗。而且现在有
: 些公司还喜欢结合他们的产品出些面试题,那就更糊涂,然后还有面试 pop quiz, 面
: 试概率题,n 多。一门概率论要认真复习起来不得几个月?
: 倒是我后来看了计算机的面试,可以刷题,可控制性高很多。
s*c
34 楼
这个说的太对了。data没法刷题,问题就会非常随机,你没做过类似的,没那方面经验
,面试就很难受。有些还要搞case interview,完全没有头绪。概率,回归原理那些,
学校刚出来还好,工作几年的再去准备那个也很痛苦,主要工作里用不上,复习了也很
快忘了。现在那么多一年半统计硕士,学校为赚钱还在扩招,出来都要找数目其实不算
很多的da,ds工作,没有内推真的很难
【在 a*****e 的大作中提到】
: 你说的正是我一直所想的。data 面试没法刷题,而且可以考的东西很多,统计一个学
: 科学完硕士就有十几,几十个 subject. 面试的时候,简历上的东西准备的时候还有个
: 头绪,应对,而对于面试官要问的那些random problem solving 的问题,真的只有碰
: 运气,你面试前如果凑巧看了,那还算好,如果没看到,那就... 除了那些数学统计基
: 础超好,经过n 年幸苦的人面试起来不是很累,一般人提前一年准备都汗。而且现在有
: 些公司还喜欢结合他们的产品出些面试题,那就更糊涂,然后还有面试 pop quiz, 面
: 试概率题,n 多。一门概率论要认真复习起来不得几个月?
: 倒是我后来看了计算机的面试,可以刷题,可控制性高很多。
,面试就很难受。有些还要搞case interview,完全没有头绪。概率,回归原理那些,
学校刚出来还好,工作几年的再去准备那个也很痛苦,主要工作里用不上,复习了也很
快忘了。现在那么多一年半统计硕士,学校为赚钱还在扩招,出来都要找数目其实不算
很多的da,ds工作,没有内推真的很难
【在 a*****e 的大作中提到】
: 你说的正是我一直所想的。data 面试没法刷题,而且可以考的东西很多,统计一个学
: 科学完硕士就有十几,几十个 subject. 面试的时候,简历上的东西准备的时候还有个
: 头绪,应对,而对于面试官要问的那些random problem solving 的问题,真的只有碰
: 运气,你面试前如果凑巧看了,那还算好,如果没看到,那就... 除了那些数学统计基
: 础超好,经过n 年幸苦的人面试起来不是很累,一般人提前一年准备都汗。而且现在有
: 些公司还喜欢结合他们的产品出些面试题,那就更糊涂,然后还有面试 pop quiz, 面
: 试概率题,n 多。一门概率论要认真复习起来不得几个月?
: 倒是我后来看了计算机的面试,可以刷题,可控制性高很多。
n*e
35 楼
正是因为没法刷题,就无法给自己的水平有一个客观的评价,导致很多人高估了自己的
水平而挤这行。
就像很多无一技之长的职场新手一门心思想进投行咨询这类,仅仅是因为拼硬技能的行
业都搞不定,而投行咨询的面试貌似容易,误以为自己也能行。
码工可以刷题,很多人看一看leetcode搞不定,就主动退了。决策过程粗暴简单。
【在 a*****e 的大作中提到】
: 你说的正是我一直所想的。data 面试没法刷题,而且可以考的东西很多,统计一个学
: 科学完硕士就有十几,几十个 subject. 面试的时候,简历上的东西准备的时候还有个
: 头绪,应对,而对于面试官要问的那些random problem solving 的问题,真的只有碰
: 运气,你面试前如果凑巧看了,那还算好,如果没看到,那就... 除了那些数学统计基
: 础超好,经过n 年幸苦的人面试起来不是很累,一般人提前一年准备都汗。而且现在有
: 些公司还喜欢结合他们的产品出些面试题,那就更糊涂,然后还有面试 pop quiz, 面
: 试概率题,n 多。一门概率论要认真复习起来不得几个月?
: 倒是我后来看了计算机的面试,可以刷题,可控制性高很多。
水平而挤这行。
就像很多无一技之长的职场新手一门心思想进投行咨询这类,仅仅是因为拼硬技能的行
业都搞不定,而投行咨询的面试貌似容易,误以为自己也能行。
码工可以刷题,很多人看一看leetcode搞不定,就主动退了。决策过程粗暴简单。
【在 a*****e 的大作中提到】
: 你说的正是我一直所想的。data 面试没法刷题,而且可以考的东西很多,统计一个学
: 科学完硕士就有十几,几十个 subject. 面试的时候,简历上的东西准备的时候还有个
: 头绪,应对,而对于面试官要问的那些random problem solving 的问题,真的只有碰
: 运气,你面试前如果凑巧看了,那还算好,如果没看到,那就... 除了那些数学统计基
: 础超好,经过n 年幸苦的人面试起来不是很累,一般人提前一年准备都汗。而且现在有
: 些公司还喜欢结合他们的产品出些面试题,那就更糊涂,然后还有面试 pop quiz, 面
: 试概率题,n 多。一门概率论要认真复习起来不得几个月?
: 倒是我后来看了计算机的面试,可以刷题,可控制性高很多。
j*r
36 楼
压力比较低是真的,没有实时系统,不on call.
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
s*r
37 楼
DE还是偏码农一些,要求编程技术。
压力比较小。做的东西一般不直接面向用户需求,主要是内部需要,着急上火的活不多
,oncall比较轻松
绝对是大叔和大妈的养老首选
http://www.mitbbs.com/article_t/JobHunting/33245853.html
【在 f*********r 的大作中提到】
: 其实都是冰山效应,码工也好,data也好,风光的都是金字塔顶上的那一块。但是现在
: 码工整体这块蛋糕比data和其他类似的传统行业大得多,所以码工的大包裹貌似远超
: data。做职业规划除了看整体蛋糕大小,还要看长期发展,码工长期看还是偏青春饭,
: 走上管理track的凤毛麟角,更别提还有阿三打压。data相关工作长期看更适合养老,
: 技术进化慢,主要是大企业技术更新慢,所以经验没那么容易过时。相反码工的
: framework和新语言层出不穷,特别是互联网相关的,这个和新的应用是相辅相成的,
: 好处是机会多,有点子就可以快速创业,缺点是山头太多跟不过来,所谓成也萧何败也
: 萧何。
: 个人觉得年轻人刚毕业的或者转行的,码工还是最佳选择。但是上了年纪拖家带口刷题
: 搞不动了的,但是又有统计之类的背景,比如ee,千老出身的,转行去data可能更合适
压力比较小。做的东西一般不直接面向用户需求,主要是内部需要,着急上火的活不多
,oncall比较轻松
绝对是大叔和大妈的养老首选
http://www.mitbbs.com/article_t/JobHunting/33245853.html
【在 f*********r 的大作中提到】
: 其实都是冰山效应,码工也好,data也好,风光的都是金字塔顶上的那一块。但是现在
: 码工整体这块蛋糕比data和其他类似的传统行业大得多,所以码工的大包裹貌似远超
: data。做职业规划除了看整体蛋糕大小,还要看长期发展,码工长期看还是偏青春饭,
: 走上管理track的凤毛麟角,更别提还有阿三打压。data相关工作长期看更适合养老,
: 技术进化慢,主要是大企业技术更新慢,所以经验没那么容易过时。相反码工的
: framework和新语言层出不穷,特别是互联网相关的,这个和新的应用是相辅相成的,
: 好处是机会多,有点子就可以快速创业,缺点是山头太多跟不过来,所谓成也萧何败也
: 萧何。
: 个人觉得年轻人刚毕业的或者转行的,码工还是最佳选择。但是上了年纪拖家带口刷题
: 搞不动了的,但是又有统计之类的背景,比如ee,千老出身的,转行去data可能更合适
j*r
38 楼
a*e
39 楼
真要是就考概率,回归那些问题还好,但是几十,十几个subject 有太多可以考的东西
,就算考概率,回归,也会考的很难。一个概率就有 a practical guide to
quantitative finance interviews 那本书的难度。其它科目也要自己搞得很懂。说真
的,比计算机难面。
【在 s***c 的大作中提到】
: 这个说的太对了。data没法刷题,问题就会非常随机,你没做过类似的,没那方面经验
: ,面试就很难受。有些还要搞case interview,完全没有头绪。概率,回归原理那些,
: 学校刚出来还好,工作几年的再去准备那个也很痛苦,主要工作里用不上,复习了也很
: 快忘了。现在那么多一年半统计硕士,学校为赚钱还在扩招,出来都要找数目其实不算
: 很多的da,ds工作,没有内推真的很难
,就算考概率,回归,也会考的很难。一个概率就有 a practical guide to
quantitative finance interviews 那本书的难度。其它科目也要自己搞得很懂。说真
的,比计算机难面。
【在 s***c 的大作中提到】
: 这个说的太对了。data没法刷题,问题就会非常随机,你没做过类似的,没那方面经验
: ,面试就很难受。有些还要搞case interview,完全没有头绪。概率,回归原理那些,
: 学校刚出来还好,工作几年的再去准备那个也很痛苦,主要工作里用不上,复习了也很
: 快忘了。现在那么多一年半统计硕士,学校为赚钱还在扩招,出来都要找数目其实不算
: 很多的da,ds工作,没有内推真的很难
M*0
40 楼
满眼望去 都是门外汉在点评DS...
头上就井口那么巴掌大的天
头上就井口那么巴掌大的天
C*n
44 楼
不一定
d*r
46 楼
同意,技术公司的所谓Data science职位都是野鸡职位。
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
S*t
47 楼
谢谢回复,我原以为是有什么最新的针对k-means的研究成果……
如果是这样的话,这种clustering algorithm还蛮多的 >_<
【在 a*****e 的大作中提到】
: https://en.wikipedia.org/wiki/Affinity_propagation
: http://scikit-learn.org/stable/auto_examples/cluster/plot_affinity_propagation.html
: Affinity Propagation. 都出来对应的python 包了。idea 最早10年左右前就出来了吧
: 。可能还有别的方法。
如果是这样的话,这种clustering algorithm还蛮多的 >_<
【在 a*****e 的大作中提到】
: https://en.wikipedia.org/wiki/Affinity_propagation
: http://scikit-learn.org/stable/auto_examples/cluster/plot_affinity_propagation.html
: Affinity Propagation. 都出来对应的python 包了。idea 最早10年左右前就出来了吧
: 。可能还有别的方法。
i*n
49 楼
看了整个thread,奇怪为什么没有人给个DS的JD, DS在tech公司的主要产品的list。
没有根据的批评和夸奖都是耍流氓。。。
没有根据的批评和夸奖都是耍流氓。。。
x*4
51 楼
我觉得现在的跟data science挂上钩的主要是这几种:
1)做 machine learning, deep learning。实现新算法或者深度customize现有的算法
。这种对数学和编程的要求都很高,基本都是phd(大部分cs,小部分统计)。钱肯定
多,bar也更高。但是坑不多,小公司短平快出活的地方一般都不会搞这些。
2)套现有的package(scikit learn,各种r 或者spark package),针对公司的数据
做简单model的。这种要对package熟悉。需要的编程主要是怎样抓数据,工作中不太需
要cs的算法。cs ms或者动手能力强的统计ms也可以干。小公司可能养2-3这样的人,但
是机会肯定比传统码农少。
3)做KPI,分析ab test数据。这种基本不编程,用的工具主要是sql和tableau之类的
。我觉得找个本科生训练一下基本也会干。而且这种对买嘴皮的能力要求比较高,因为
经常要对KPI的变化或者ab test的结果编故事。老中干这个不容易,很有可能后面进来
的小白很快就变成你老板。
还有就是data engineering这一块,搞infra或者ETL pipeline,我觉得基本就是cs码
农跟统计和数学没什么关系。
总的来说,DS除非很牛(做1),否则对老中来说还不如去当传统码农。
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
1)做 machine learning, deep learning。实现新算法或者深度customize现有的算法
。这种对数学和编程的要求都很高,基本都是phd(大部分cs,小部分统计)。钱肯定
多,bar也更高。但是坑不多,小公司短平快出活的地方一般都不会搞这些。
2)套现有的package(scikit learn,各种r 或者spark package),针对公司的数据
做简单model的。这种要对package熟悉。需要的编程主要是怎样抓数据,工作中不太需
要cs的算法。cs ms或者动手能力强的统计ms也可以干。小公司可能养2-3这样的人,但
是机会肯定比传统码农少。
3)做KPI,分析ab test数据。这种基本不编程,用的工具主要是sql和tableau之类的
。我觉得找个本科生训练一下基本也会干。而且这种对买嘴皮的能力要求比较高,因为
经常要对KPI的变化或者ab test的结果编故事。老中干这个不容易,很有可能后面进来
的小白很快就变成你老板。
还有就是data engineering这一块,搞infra或者ETL pipeline,我觉得基本就是cs码
农跟统计和数学没什么关系。
总的来说,DS除非很牛(做1),否则对老中来说还不如去当传统码农。
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
f*y
52 楼
完全同意。ds比码农差这是大家都公认的。但是很多DS/DA赚不了码农呀。就像
accouting转DS也不容易一样。大家都想钱多的,也要看精力和本事。
【在 x***4 的大作中提到】
: 我觉得现在的跟data science挂上钩的主要是这几种:
: 1)做 machine learning, deep learning。实现新算法或者深度customize现有的算法
: 。这种对数学和编程的要求都很高,基本都是phd(大部分cs,小部分统计)。钱肯定
: 多,bar也更高。但是坑不多,小公司短平快出活的地方一般都不会搞这些。
: 2)套现有的package(scikit learn,各种r 或者spark package),针对公司的数据
: 做简单model的。这种要对package熟悉。需要的编程主要是怎样抓数据,工作中不太需
: 要cs的算法。cs ms或者动手能力强的统计ms也可以干。小公司可能养2-3这样的人,但
: 是机会肯定比传统码农少。
: 3)做KPI,分析ab test数据。这种基本不编程,用的工具主要是sql和tableau之类的
: 。我觉得找个本科生训练一下基本也会干。而且这种对买嘴皮的能力要求比较高,因为
accouting转DS也不容易一样。大家都想钱多的,也要看精力和本事。
【在 x***4 的大作中提到】
: 我觉得现在的跟data science挂上钩的主要是这几种:
: 1)做 machine learning, deep learning。实现新算法或者深度customize现有的算法
: 。这种对数学和编程的要求都很高,基本都是phd(大部分cs,小部分统计)。钱肯定
: 多,bar也更高。但是坑不多,小公司短平快出活的地方一般都不会搞这些。
: 2)套现有的package(scikit learn,各种r 或者spark package),针对公司的数据
: 做简单model的。这种要对package熟悉。需要的编程主要是怎样抓数据,工作中不太需
: 要cs的算法。cs ms或者动手能力强的统计ms也可以干。小公司可能养2-3这样的人,但
: 是机会肯定比传统码农少。
: 3)做KPI,分析ab test数据。这种基本不编程,用的工具主要是sql和tableau之类的
: 。我觉得找个本科生训练一下基本也会干。而且这种对买嘴皮的能力要求比较高,因为
i*n
53 楼
是Job description,最近被周围找工作的带跑了,没说清楚,不好意思:)。
的确现在data scientist这个词有点用坏,用烂了,很模糊,不清楚。很多做database
的,infra的都搞成这个title了,对此的确表示很不满。对!只知道A/B testing,而
不知道t test的,绝对不能叫data scientist。
我自己接触过的一些比较有意思的data scientist 的projects。 就算提供一下关于DS
的背景吧
1) 做recommendation system, 这个里面主要是怎么衡量两个items之间的相似性,怎
么取features出来。 比如说是牛奶和啤酒关联性高, 还是尿布和啤酒关联性高。
google 的page rank 相对就简单些了
2) supply chain的优化, 主要就是考虑在什么地方建工厂,运输成品能优化。
3) demand forecast, 这个主要要解决的就是决定一个店的optimal 库存
4) price optimization 决定新产品的optimal price,利润最大化,iphone 是怎么
选择那几个内存大小的,每个的价钱又为神马定成那样
5) industry trend prediction 从各个公司的public released 数据,判断某些公司
的下一步的发展方向
6) System incident prediction 就是看看机器大概什么时候down,要在大概什么时
间更新换代
其他的小的toy problems,还有像fraud detection(判断某比交易是不是fraud,
order要不要cancel, ebay和amazon应该有很多人弄),ad targeting。 其他的应该
还有不少有意思的projects.
支持做end to end 的码工+data scientist, 也一直在这条路上努力。看见自己own
的一个project真的被应用而且效果很好,还是很有满足感的。
【在 a*******g 的大作中提到】
: JD是什么玩意?jod description?
: 你们平时这么说话跟人没有交流障碍吗?
的确现在data scientist这个词有点用坏,用烂了,很模糊,不清楚。很多做database
的,infra的都搞成这个title了,对此的确表示很不满。对!只知道A/B testing,而
不知道t test的,绝对不能叫data scientist。
我自己接触过的一些比较有意思的data scientist 的projects。 就算提供一下关于DS
的背景吧
1) 做recommendation system, 这个里面主要是怎么衡量两个items之间的相似性,怎
么取features出来。 比如说是牛奶和啤酒关联性高, 还是尿布和啤酒关联性高。
google 的page rank 相对就简单些了
2) supply chain的优化, 主要就是考虑在什么地方建工厂,运输成品能优化。
3) demand forecast, 这个主要要解决的就是决定一个店的optimal 库存
4) price optimization 决定新产品的optimal price,利润最大化,iphone 是怎么
选择那几个内存大小的,每个的价钱又为神马定成那样
5) industry trend prediction 从各个公司的public released 数据,判断某些公司
的下一步的发展方向
6) System incident prediction 就是看看机器大概什么时候down,要在大概什么时
间更新换代
其他的小的toy problems,还有像fraud detection(判断某比交易是不是fraud,
order要不要cancel, ebay和amazon应该有很多人弄),ad targeting。 其他的应该
还有不少有意思的projects.
支持做end to end 的码工+data scientist, 也一直在这条路上努力。看见自己own
的一个project真的被应用而且效果很好,还是很有满足感的。
【在 a*******g 的大作中提到】
: JD是什么玩意?jod description?
: 你们平时这么说话跟人没有交流障碍吗?
l*n
54 楼
烙印是做好ppt吧
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
s*7
55 楼
赞总结分享。
database
DS
【在 i**********n 的大作中提到】
: 是Job description,最近被周围找工作的带跑了,没说清楚,不好意思:)。
: 的确现在data scientist这个词有点用坏,用烂了,很模糊,不清楚。很多做database
: 的,infra的都搞成这个title了,对此的确表示很不满。对!只知道A/B testing,而
: 不知道t test的,绝对不能叫data scientist。
: 我自己接触过的一些比较有意思的data scientist 的projects。 就算提供一下关于DS
: 的背景吧
: 1) 做recommendation system, 这个里面主要是怎么衡量两个items之间的相似性,怎
: 么取features出来。 比如说是牛奶和啤酒关联性高, 还是尿布和啤酒关联性高。
: google 的page rank 相对就简单些了
: 2) supply chain的优化, 主要就是考虑在什么地方建工厂,运输成品能优化。
database
DS
【在 i**********n 的大作中提到】
: 是Job description,最近被周围找工作的带跑了,没说清楚,不好意思:)。
: 的确现在data scientist这个词有点用坏,用烂了,很模糊,不清楚。很多做database
: 的,infra的都搞成这个title了,对此的确表示很不满。对!只知道A/B testing,而
: 不知道t test的,绝对不能叫data scientist。
: 我自己接触过的一些比较有意思的data scientist 的projects。 就算提供一下关于DS
: 的背景吧
: 1) 做recommendation system, 这个里面主要是怎么衡量两个items之间的相似性,怎
: 么取features出来。 比如说是牛奶和啤酒关联性高, 还是尿布和啤酒关联性高。
: google 的page rank 相对就简单些了
: 2) supply chain的优化, 主要就是考虑在什么地方建工厂,运输成品能优化。
S*r
56 楼
总结得雅俗共赏,赞
data的工作应该是细分一下以后做比较才有意义。DS的职位不多,DE,DA的职位大把,
就是包裹上不了台面。
database
DS
【在 i**********n 的大作中提到】
: 是Job description,最近被周围找工作的带跑了,没说清楚,不好意思:)。
: 的确现在data scientist这个词有点用坏,用烂了,很模糊,不清楚。很多做database
: 的,infra的都搞成这个title了,对此的确表示很不满。对!只知道A/B testing,而
: 不知道t test的,绝对不能叫data scientist。
: 我自己接触过的一些比较有意思的data scientist 的projects。 就算提供一下关于DS
: 的背景吧
: 1) 做recommendation system, 这个里面主要是怎么衡量两个items之间的相似性,怎
: 么取features出来。 比如说是牛奶和啤酒关联性高, 还是尿布和啤酒关联性高。
: google 的page rank 相对就简单些了
: 2) supply chain的优化, 主要就是考虑在什么地方建工厂,运输成品能优化。
data的工作应该是细分一下以后做比较才有意义。DS的职位不多,DE,DA的职位大把,
就是包裹上不了台面。
database
DS
【在 i**********n 的大作中提到】
: 是Job description,最近被周围找工作的带跑了,没说清楚,不好意思:)。
: 的确现在data scientist这个词有点用坏,用烂了,很模糊,不清楚。很多做database
: 的,infra的都搞成这个title了,对此的确表示很不满。对!只知道A/B testing,而
: 不知道t test的,绝对不能叫data scientist。
: 我自己接触过的一些比较有意思的data scientist 的projects。 就算提供一下关于DS
: 的背景吧
: 1) 做recommendation system, 这个里面主要是怎么衡量两个items之间的相似性,怎
: 么取features出来。 比如说是牛奶和啤酒关联性高, 还是尿布和啤酒关联性高。
: google 的page rank 相对就简单些了
: 2) supply chain的优化, 主要就是考虑在什么地方建工厂,运输成品能优化。
C*0
59 楼
管窥蠡测,井底之蛙,鼠目寸光。
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
p*r
60 楼
所以说老中脑子就是一根筋,关键不是要跳什么坑,而是看那一行热,在简历里把自己
包装成这一行的专家。专攻什么都不如专供写简历。
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
包装成这一行的专家。专攻什么都不如专供写简历。
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
t*h
61 楼
无条件顶逼哥
[在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到:]
:不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得
无数人跳坑。究其原因无非是以下几点。
:1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
:商是硬通货,脑力不够用而避重就轻,输在起点上了。
:些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。
有大数据系统经验的码工包裹很高。
:andrew ng那种吗?不是那你high个屁。
:业务部门呼来喝去的shared services。
:职业发展都远远不如码工。职位都没几个,发展个毛呢?
:其实要找到好的data的职位,还是得靠码工的技能,这个是无法回避的。烙印就不趟
这个浑水,集中精力一门心思做码工。大家最好还是醒醒,认清现实,向烙印学习。
[在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到:]
:不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得
无数人跳坑。究其原因无非是以下几点。
:1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
:商是硬通货,脑力不够用而避重就轻,输在起点上了。
:些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。
有大数据系统经验的码工包裹很高。
:andrew ng那种吗?不是那你high个屁。
:业务部门呼来喝去的shared services。
:职业发展都远远不如码工。职位都没几个,发展个毛呢?
:其实要找到好的data的职位,还是得靠码工的技能,这个是无法回避的。烙印就不趟
这个浑水,集中精力一门心思做码工。大家最好还是醒醒,认清现实,向烙印学习。
n*e
62 楼
在沙滩上躺着灌水?
【在 t**********h 的大作中提到】
: 无条件顶逼哥
: [在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到:]
: :不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得
: 无数人跳坑。究其原因无非是以下几点。
: :1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: :商是硬通货,脑力不够用而避重就轻,输在起点上了。
: :些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。
: 有大数据系统经验的码工包裹很高。
: :andrew ng那种吗?不是那你high个屁。
: :业务部门呼来喝去的shared services。
【在 t**********h 的大作中提到】
: 无条件顶逼哥
: [在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到:]
: :不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得
: 无数人跳坑。究其原因无非是以下几点。
: :1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: :商是硬通货,脑力不够用而避重就轻,输在起点上了。
: :些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。
: 有大数据系统经验的码工包裹很高。
: :andrew ng那种吗?不是那你high个屁。
: :业务部门呼来喝去的shared services。
t*h
63 楼
乡下
[在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到:]
:在沙滩上躺着灌水?
[在 niubee (资深街霸卧槽立马勒戈壁) 的大作中提到:]
:在沙滩上躺着灌水?
n*3
65 楼
actually end2end solution for DS is NOT so hard now.
after protype the model, just pipe it with some other ETL tools, spark/spark
streaming, kafaka...
then done.
The key is to have good habit of programming style and take advantage of the
tool like docker, CI tools..
Nowdays, get a system done is like play legos, just pipe them together.
there will be a lot
of "KEN", but with google search, not that bad.
database
DS
【在 i**********n 的大作中提到】
: 是Job description,最近被周围找工作的带跑了,没说清楚,不好意思:)。
: 的确现在data scientist这个词有点用坏,用烂了,很模糊,不清楚。很多做database
: 的,infra的都搞成这个title了,对此的确表示很不满。对!只知道A/B testing,而
: 不知道t test的,绝对不能叫data scientist。
: 我自己接触过的一些比较有意思的data scientist 的projects。 就算提供一下关于DS
: 的背景吧
: 1) 做recommendation system, 这个里面主要是怎么衡量两个items之间的相似性,怎
: 么取features出来。 比如说是牛奶和啤酒关联性高, 还是尿布和啤酒关联性高。
: google 的page rank 相对就简单些了
: 2) supply chain的优化, 主要就是考虑在什么地方建工厂,运输成品能优化。
after protype the model, just pipe it with some other ETL tools, spark/spark
streaming, kafaka...
then done.
The key is to have good habit of programming style and take advantage of the
tool like docker, CI tools..
Nowdays, get a system done is like play legos, just pipe them together.
there will be a lot
of "KEN", but with google search, not that bad.
database
DS
【在 i**********n 的大作中提到】
: 是Job description,最近被周围找工作的带跑了,没说清楚,不好意思:)。
: 的确现在data scientist这个词有点用坏,用烂了,很模糊,不清楚。很多做database
: 的,infra的都搞成这个title了,对此的确表示很不满。对!只知道A/B testing,而
: 不知道t test的,绝对不能叫data scientist。
: 我自己接触过的一些比较有意思的data scientist 的projects。 就算提供一下关于DS
: 的背景吧
: 1) 做recommendation system, 这个里面主要是怎么衡量两个items之间的相似性,怎
: 么取features出来。 比如说是牛奶和啤酒关联性高, 还是尿布和啤酒关联性高。
: google 的page rank 相对就简单些了
: 2) supply chain的优化, 主要就是考虑在什么地方建工厂,运输成品能优化。
i*n
66 楼
其实我觉得成为end to end 不是真正自己要一个人做一个project
我自己的经验更多的是能够方便沟通,避免一些问题。比如一些database看起来建的很
不合理, 但是真的知道了一些database的东西,就能理解为什么会弄成这样。双方怎
么能做一些合适的妥协,作为data scientist也不会提一些对做modelling有利,但是
要花费别人太多时间的‘无礼’要求。
当然code style 也很重要,同时也比较重要的当把model给到下端implement和deploy
的时候,还是会提醒一些corner case和可能会之后加的要求(拓展性)的。因为了解
一些后期系统的设计,更能给一些有用的意见的。
spark
the
【在 n*****3 的大作中提到】
: actually end2end solution for DS is NOT so hard now.
: after protype the model, just pipe it with some other ETL tools, spark/spark
: streaming, kafaka...
: then done.
: The key is to have good habit of programming style and take advantage of the
: tool like docker, CI tools..
: Nowdays, get a system done is like play legos, just pipe them together.
: there will be a lot
: of "KEN", but with google search, not that bad.
:
我自己的经验更多的是能够方便沟通,避免一些问题。比如一些database看起来建的很
不合理, 但是真的知道了一些database的东西,就能理解为什么会弄成这样。双方怎
么能做一些合适的妥协,作为data scientist也不会提一些对做modelling有利,但是
要花费别人太多时间的‘无礼’要求。
当然code style 也很重要,同时也比较重要的当把model给到下端implement和deploy
的时候,还是会提醒一些corner case和可能会之后加的要求(拓展性)的。因为了解
一些后期系统的设计,更能给一些有用的意见的。
spark
the
【在 n*****3 的大作中提到】
: actually end2end solution for DS is NOT so hard now.
: after protype the model, just pipe it with some other ETL tools, spark/spark
: streaming, kafaka...
: then done.
: The key is to have good habit of programming style and take advantage of the
: tool like docker, CI tools..
: Nowdays, get a system done is like play legos, just pipe them together.
: there will be a lot
: of "KEN", but with google search, not that bad.
:
c*d
67 楼
赞牛哥
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
【在 n****e 的大作中提到】
: 不知道从什么时候开始,data这个词汇开始在华人圈流行起来了,泡泡越吹越大引得无
: 数人跳坑。究其原因无非是以下几点。
: 1. 看似容易。很多人无非就是觉得编程序头疼,而data貌似容易一些。这个时代,智
: 商是硬通货,脑力不够用而避重就轻,输在起点上了。
: 2. 看似前途远大。各种媒体疯狂吹嘘大数据机器学习这类虚头八脑的东西。其实做这
: 些的公司不多,做的也不过是运用了一些data技术的系统,还是靠大量码工来实现。有
: 大数据系统经验的码工包裹很高。
: 3. 看似比码工高大上。有数学,有统计,搞好了模型丢给码工去实现。你的职位是
: andrew ng那种吗?不是那你high个屁。
: 4. 自我感觉是公司业务核心。其实就是个打杂的,处理数据的。地位最低了,被其他
j*g
69 楼
赞牛哥
t*n
70 楼
NB说的基本在理
包裹能和swe比的ds职位
确实不在一个数量级-至少目前来说
包裹能和swe比的ds职位
确实不在一个数量级-至少目前来说
w*0
71 楼
看了第一页帖子 就看到两个截然相反的观点
前面一个人说 做data的“技术和理论万年不变,工作非常稳定,适合养老” 所
以是好的
后面又一个人说 做infra变化已经不多了, 不好,
而“data目前是个变化很快的领域” 所以比码工好
诸位都是做技术的 结果还一堆连文科生都不如的逻辑水平...........
前面一个人说 做data的“技术和理论万年不变,工作非常稳定,适合养老” 所
以是好的
后面又一个人说 做infra变化已经不多了, 不好,
而“data目前是个变化很快的领域” 所以比码工好
诸位都是做技术的 结果还一堆连文科生都不如的逻辑水平...........
t*e
74 楼
https://en.wikipedia.org/wiki/DBSCAN
【在 S******t 的大作中提到】
: 谢谢回复,我原以为是有什么最新的针对k-means的研究成果……
: 如果是这样的话,这种clustering algorithm还蛮多的 >_<
【在 S******t 的大作中提到】
: 谢谢回复,我原以为是有什么最新的针对k-means的研究成果……
: 如果是这样的话,这种clustering algorithm还蛮多的 >_<
a*e
75 楼
相关阅读
Team match能跟recruiter说要老中manager吗索南开发一个GPS双向收发的设备apple面试已挂职业发展求教niantic 怎么样?该不该跳?(更新)请问谁有纽约附近好的icc推荐的,谢谢Accenture的contractor机会,银行驻场网络安全工程师北京航空航天大学环境学院诚聘 “青年千人计划”和“卓越百人计 (转载)Apple家有面试冷冻期么?跳槽一般涨多少算reasonable?netflix 招人的要求狗家年终奖今年咋样诚信请教个小offerthis is really awesome.paint house (leetcode), 如果K colors, M个houses在一个环上应该怎么做?入门data scientist,湾区有13万起薪么?我也想去那个hacker rank那个bootcamp发现误入烙印组了求金融/CS前辈们指点迷津:经济小硕找不到工作要不要转行做程序员?