LinkedIn Data Scientist 面经 偏统计# JobHunting - 待字闺中
f*c
1 楼
第一次on-campus interview. 主要问了三个东西:
1.1个store 有10排队 每个队只有一个收银员,然后每个队伍有10个人在排队。另一个
store只有1排队,有10个收银员,有100人在排队,问你会选择哪个队伍来排,假设每个
收银员办理一个客户的时间和variance一样。 那两个Store的expected waiting time
是一样的
但是variance不一样 主要是分析mean-variance
2.问在java里“==”和.equals的区别 还有如果.equals要继承的话怎么写
3.数据分析。linkedin 现在卖一种license给其他公司(每个license可以看成一种产品
)。大概4或者6个公司的数据,每个data point里有三个variable,1.公司名字,2.# of
license purchased 3.unit license的价格. 先问能从数据里看出什么,
基本就是#of license purchased 和unit price正相关。但是这不能说明我们可以提高
unit price来增加# of license purchased.
接着他又给了去年这些公司的# of license purchased 和unit price的情况,问怎么分
析。
第二次是电面,悲剧了。主要面试的是如何建立一个统计模型来预测一个人会不会换工
作,怎么收集数据,尤其是有哪些linkedin数据可以用,需要对linkedin比较了解。另
外如何怎么建model。以及收集数据中有bias怎么办。
通过这些面试和聊天,发现LinkedIn data scientist既做一些统计模型来支持产品开
发,同时也做一些经济分析,就像第二个面试里的例子。而且针对不同背景的人问得也
不太一样。因为我不是cs背景,所以编程方面问的就比较少。
不过要抱怨一下他们的recruiter!第二个面试前2天告诉是test programming skills,
要用collabedit,练习整整两天编程 结果问的是建立model...实在是不靠谱啊。。。
1.1个store 有10排队 每个队只有一个收银员,然后每个队伍有10个人在排队。另一个
store只有1排队,有10个收银员,有100人在排队,问你会选择哪个队伍来排,假设每个
收银员办理一个客户的时间和variance一样。 那两个Store的expected waiting time
是一样的
但是variance不一样 主要是分析mean-variance
2.问在java里“==”和.equals的区别 还有如果.equals要继承的话怎么写
3.数据分析。linkedin 现在卖一种license给其他公司(每个license可以看成一种产品
)。大概4或者6个公司的数据,每个data point里有三个variable,1.公司名字,2.# of
license purchased 3.unit license的价格. 先问能从数据里看出什么,
基本就是#of license purchased 和unit price正相关。但是这不能说明我们可以提高
unit price来增加# of license purchased.
接着他又给了去年这些公司的# of license purchased 和unit price的情况,问怎么分
析。
第二次是电面,悲剧了。主要面试的是如何建立一个统计模型来预测一个人会不会换工
作,怎么收集数据,尤其是有哪些linkedin数据可以用,需要对linkedin比较了解。另
外如何怎么建model。以及收集数据中有bias怎么办。
通过这些面试和聊天,发现LinkedIn data scientist既做一些统计模型来支持产品开
发,同时也做一些经济分析,就像第二个面试里的例子。而且针对不同背景的人问得也
不太一样。因为我不是cs背景,所以编程方面问的就比较少。
不过要抱怨一下他们的recruiter!第二个面试前2天告诉是test programming skills,
要用collabedit,练习整整两天编程 结果问的是建立model...实在是不靠谱啊。。。