Redian新闻
>
说说Facebook的Data Scientists职位 (转载)
avatar
说说Facebook的Data Scientists职位 (转载)# DataSciences - 数据科学
c*i
1
3月6日下午,江西代表团驻地,望着静静放在房间角落精心包装的两瓶山茶油,全
国人大代表、江西赣县五云镇镇长明经华不由地轻皱眉头,遗憾和自责之余,又感到振
奋。
在来北京参加全国人代会之前,明经华特意拜访兴国百岁老红军王承登。王老十分
高兴,特地写了一封信,还准备了一份特殊的礼物----两瓶兴国产的山茶油,委托她转
呈习总书记,表达赣南苏区老红军和老表对党中央和习总书记的感激之情。
……中央办公厅的同志告诉明经华,中央有明确规定,不能收任何礼物。习总书记
也特别告诫,参会人员不能给他带任何礼物和土特产。老红军的心意领了,但是礼物不
能收。(2015,3,8“人民日报客户端”《赣南百岁老红军托付代表转送两瓶山茶油,
习近平婉拒称心领了》)
看完这则报道时,感觉百岁老红军的托付代表向总书记赠送山茶油,其中有许多“
特殊”。第一、送礼者是一位百岁老红军;第二、两瓶山茶油是兴国土产,且“茶油是
个‘宝’,可以食用,又有药用价值”,是老红军的精心所选;第三、送山茶油是因为
在党中央、国务院的关怀下,当地的老同志“得到很多实惠”,方方面面有了很大改善
,想表达一片感激之情;第四、“当年,赣南老区群众就是用茶油、钨砂,从白区换回
食盐、药品、武器等物资支援红军;现在,乡亲们通过种油茶来赚钱,全市有8万多困
难群众种油茶脱了贫”,其中有着“特殊的感情和意义”;第五、就数量而言,只有区
区两瓶。但就在那么多“特殊”存在的情况下,根据总书记的指示,中央办公厅的同志
却予以了婉拒。
因为“习近平婉拒称心领了”,人们或许能想到一个问题。那就是在反腐败中,为
啥总书记能婉拒老红军的送茶油,但许多人却因何对送来的钱物如此难拒?且有多少人
在收?为啥在反腐败中出现了为公众所一直诟病和“冷笑话”不断的“怪胎”——廉政
账户?
说到所谓的“廉政账户”,人们一定会想到不少贪官的惯用伎俩——“小头交廉政
账户,自己得大头”。于贪官这样的惯用伎俩,用一个例子即可以生动说明:“据统计
,自2005年10月至2014年1月,(安徽省六安市政府原副秘书长)魏力生先后收受他人
款项49笔,共计现金327万余元、购物卡31万元、银行现金卡0.8万元、黄金1300克。在
此期间,魏力生上交至安徽省纪委廉政账户和六安市纪委廉政账户共计75万余元,案发
后,这些钱没有算进其受贿范围”。
如果魏力生这样的卑劣伎俩只是一个个例,或这样的事少之又少,公众自然没有任
何理由可以指责,也没有必要担忧和追究。然而客观存在的事实是,这样的动作绝非魏
力生一人。如果一定要细细列来,竟可以举出很多很多,于是问题来了!真的那么难拒
?为啥?
我之所以说所谓的“廉政账户”是“怪胎”,道理很简单。第一、总书记能婉拒,
为什么许多为官者不能?第二、“小头交廉政账户,自己得大头”的情况存在,不说明
所谓的“廉政账户”,竟成了不少贪官贪得无厌的“挡箭牌”、“遮羞布”?第三、正
因为如此,为此而大胆伸手却欺骗组织的,不成了“名正言顺”?不成了纪检监察部门
客观意义上的“怂恿”?第四、当不少地方纪检监察部门将此用为反腐败成绩向上报送
时,不成了自打耳光?第五、就在这样的情况下,谁能让“小头交廉政账户,自己得大
头”的怪事和贪腐绝迹?正因为如此我想说:
“廉政账户”可以休矣!
avatar
d*n
2
【 以下文字转载自 Statistics 讨论区 】
发信人: songkun (告别棒球场), 信区: Statistics
标 题: 说说Facebook的Data Scientists职位
发信站: BBS 未名空间站 (Thu Nov 27 03:01:39 2014, 美东)
Facebook有两种data scientist, 一种是core data scientist, 招的人比较像MSR, 或
者Google Research那种profile. 另一种是product data scientist. 我下面主要针对
第二种说.
先说analytics org, 基本可以概括成分散集中制, 工作时分散的, 管理是集中的.
Facebook大体上可以分成product org和business org. 后者是sales/HR/marketing/
Finance等等那些部门, 而data scientists是属于product org. 对于product org, 又
分成众多的product units, 大体有100多个. 每个team基本是4个主要pillars组成
engineering, pm, analysts (data scientist), product designers. 所以整个
Facebook一共有一百多个data scientists, 工作领域是分散在不同units, 但是
reporting structure是集中的. 所以hiring也是集中的. 面试Facebook的data
scientist, 是general hiring pool, 不分组的, 进来以后再allocate. 这点上和
engineers, PMs 什么的都相同. 之所以要这样, 是为了让analytics保持独立性, 更好
的为产品提供insights,而不完全受product的制约, 换句话说, 你的老板是analytics
head, 而不是你工作的那个product的head. 再有就是这样会形成analytics community
, 容易share resources, best practices, 等等.
再说data scientists的日常工作组成, 基本分四项
(1) data pipelines, 这包括各种ETL, 处理数据, reporting, dashboard 等等
(2) product operation, 包括监测和产品的走向, own key metrics, 和各种ad hoc的
product support. 这种可以简单概括成被动分析, 就是有人问你关于产品问题, 你得
回答.
(3) strategic analysis, 各种exploratory的分析, 提供insight来帮助产品set
roadmaps. 这种可以简单概括成主动分析, 就是没人问你问题, 你自己要问你合适的问
题, 并且回答, 主动为产品提供发展方向.
(4) cross functional influencing. 有了insights, 要和另外几大pillars打交道(
eng, pm等等), 所以influencing必不可少.
可以想想, 每个产品的analysts, 都是和那个产品的团队坐在一起的, 而不是和你老板
坐在一起. 同一个analytics team里的人, 往往是分散坐在不同的楼里, 而你老板可能
是坐在他最involve的一个产品那个组里. Analytics team有weekly meeting, 但是你
更多的时候是meet同一product team里的人.
再说data scientists面试的要点.
(1) 有"一定"的技术能力, Python + big data (比如Hive/SQL). R也可以, 但是很多
面试题用R来做恐怕有些困难, 会Python是很有帮助的. 不需要啃算法书, CS面试那种
算法题不会考. 我们只需要知道你有独立handle data的能力, 遇上事情能有技术能力
unblock你自己. 光会SQL是不行的.
(2) 有"极好"的分析能力, 这是analysts的本质, 也是面试的重点. 给你一个问题(
open ended), 看能不能 think analytically and structurally. 随便举个例子: 怎
么用FB数据分析日本核电站爆炸的影响. 这里要自己formalize这个问题, 提出假设,
思考可以用哪些数据, 怎么分析, 没有某些数据怎么替代 等等一系列步骤.
(3) 有"极好"的product sense. 因为实际工作中, 很多时候没人问你问题, 你要自己
问问题, 问正确的问题, 需要对产品有很好的理解. 这里也举个例子: 假如印度的某个
城市停电三天, 你觉得对FB会有哪些影响, 这些影响对Twitter会如何? 回答这个问题,
先得对行业和产品有一定了解, 否则根本无从下手.
当然一些其他的东西, 比如对数字的敏感度, 交流的能力等等很重要, 但是哪些都表现
在上面这些回答当中.
很大程度上, FB的data scientists需要的是通才, 而不是专才, 从上面这些问题就能
看的出来. 这也是为什么我们招进来的人什么背景的都有. 背景可以千差万别, 但是上
面三条都一定满足. 对于学统计的人, 尤其是对互联网行业比较陌生的, 可能在
product sense方面会有些challenge. 我们也面试过很多统计PhD, 有些人回答很好,
有些人就一塌糊涂, 最后的差别并不在于统计, 而是分析头脑和product sense. 这里
要说一点, 大多数中国人都比较适合回答close-ended questions(这个和咱们的教育背
景有关), 纠结于"怎么分析". 很多时候遇上"分析什么" 这种 open-ended questions
反而不知如何下手.
最后明确一下, FB现有大量的data scientists空缺, 刚兴趣的请自己申请, 也可以找
FB的朋友推荐. 因为我个人也是hiring manager之一, 也是interviewers之一, 所以我
不负责推荐.
https://www.facebook.com/careers/department?req=a0IA000000CyDjDMAV
最后说点题外话. 这个版上稍微老点的人恐怕都知道我, 我来FB之前在Google工作了7
年半. Google是个给钱多还不累的地方. FB可完全不是, FB比Google忙的多的多的多的
多, 整个公司都是这个文化. 对于mediocre performer, Google更tolerant, 而FB很多
就直接fire了. 所以追求work life balance的, 基本就不要考虑FB了.
Google是很好的公司, 也有很多牛人, 但也有很多不干活的人在公司的各个角落. FB可
以说基本没有, 至少整个analytics org一百多人, 我还没发现任何一个人有任何一点"
混"的迹象. Analytics从director到
manager到IC, 都是要做IC活的. 光管人耍嘴皮子, 在FB是吃不开的. 我老板director,
基本每天也就睡4,5个小时, 剩下时间全在工作, 又management, 又自己分析东西. 很
大程度上, FB这么大的公司, 能保持这种模式, 也算是奇迹了. 以前我在Google的时
候, 基本天天泡在这个版, 可是现在可能一两个月都不来一次了, 实在是没时间, 有时
一天忙到最后都渴的不行饿得不行了, 才发现自己一天忙得都没喝口水的时间.
avatar
H*E
3
可以说一下招进去的学历上面,phd, ms, bachelor的百分比么?
avatar
c*h
4
搜过linkedin上fb ds,phd貌似没有想象的多。很惊讶的看见很多bs in art, music啥的
尤其是就没几个phd in stat

【在 H****E 的大作中提到】
: 可以说一下招进去的学历上面,phd, ms, bachelor的百分比么?
avatar
P*k
5
看了一下,只有那个core data scientist是需要phd的
其他的ds都好像bs就可以。。。

啥的

【在 c********h 的大作中提到】
: 搜过linkedin上fb ds,phd貌似没有想象的多。很惊讶的看见很多bs in art, music啥的
: 尤其是就没几个phd in stat

avatar
c*h
6
嗯,fb的core ds比较像research scientist的感觉。

【在 P**********k 的大作中提到】
: 看了一下,只有那个core data scientist是需要phd的
: 其他的ds都好像bs就可以。。。
:
: 啥的

avatar
n*3
7
其他的ds sounds just like a business analyst,
as long as you are smart, open mind. BS/MS would be sufficient .

【在 P**********k 的大作中提到】
: 看了一下,只有那个core data scientist是需要phd的
: 其他的ds都好像bs就可以。。。
:
: 啥的

avatar
t*g
8
现在很多或者绝大部分data scientist就跟business analyst很类似。传统的BA主要是
relational database加SAS,现在很多data scientist只不过数据库换成比如hadoop,
再加些基本统计软件比如R或者python的操作。

【在 n*****3 的大作中提到】
: 其他的ds sounds just like a business analyst,
: as long as you are smart, open mind. BS/MS would be sufficient .

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。