Redian新闻
>
Pinterest 电话+onsite数据科学方向面经
avatar
Pinterest 电话+onsite数据科学方向面经# JobHunting - 待字闺中
d*p
1
没签NDA神马的,攒人品了~
电面:
1. 给一个矩阵如下:
a b c d
e f g h
i j k l
m n o p
要求按如下方式打印:
a f k p
b g l
c h
d
e j o
i n
m
2. 设计题:
如果要给每个Pin加上一个price tag,怎么去evaluate这是否work?
(1) A/B testing -> 可以有好几种,讨论优劣性
(2) metrics to monitor -> click rate, impression, return user ratio, etc
上门:
1. 假设Pinterest的更新系统只能显示3条更新,怎么设计?更新可以是:用户评论、
加新的pin,repin等等,一共可能有一千多种。讨论各种方法的优劣性
回答:a ranking problem...
2. 给如下的数据格式:

比如有一组数据:
1, 3, 100
2, 4, 200
5, 6, 300
。。。
这些数据时间点可能有重合。在时间段2~3之间,value的和是100+200 = 300. 找出这
组数据中最高的value和。
回答1: 用一个数组,每个cell代表一个timestamp,然后扫一遍数据,increment相应
的cell。-》 面试官:时间连续怎么办?有没有更好的办法。
答案:把数据变成:;然后按照时间排序。如果是start_time,就
+value,不然就-value:
int sum = 0;
int max = 0;
// sort by time
while(have more lines) {
if(type is start) sum += value;
else sum -= value;
if(sum > max) max = sum;
}
return max;
3. 设计一个数据结构支持O(1)的insert, remove, find random(老题)
4. java arraylist里如果满了,怎么办?为什么?
答: make a new copy, size double. 原因是:double size的时候需要拷贝原来的n
个数据,当当前这个长度为2*n的arraylist再满的时候,至少还需要插入n个数据,这
样平均每个数据的cost是在O(1)级别的
5. 怎么做weighted random sampling?(老题)
6. 有产生5的随机数,怎么生成7的?(老题)
7. 怎么去找log中的异常?outlier detection
觉得答的还可以,一个星期不到就告知被剧了,效率还是很高的。
avatar
x*u
2
thanks for sharing.
avatar
n*e
3
谢谢分享!
avatar
d*p
4
补充一下:
P家感觉亚裔很多,印度人很少,赞一下。据里面的人说,除了coding以外,还比较注
重culture fit,communication什么的比较重要吧。考题涉及design的也挺多,最好在
面试前熟悉一下他们的pin,board之类。
avatar
d*n
5
都答上来了吗?为什么被据呢?
avatar
j*g
6
startup要求都比较高吧
除非你的回答很impressive
我猜的
不过还是谢谢分享,pinterest的面经不太多见啊

【在 d******n 的大作中提到】
: 都答上来了吗?为什么被据呢?
avatar
l*n
7
可能标题看起来跟sde没关系,其实题目还是sde题目。

【在 d******p 的大作中提到】
: 补充一下:
: P家感觉亚裔很多,印度人很少,赞一下。据里面的人说,除了coding以外,还比较注
: 重culture fit,communication什么的比较重要吧。考题涉及design的也挺多,最好在
: 面试前熟悉一下他们的pin,board之类。

avatar
c*m
8
谢谢lz,
那我来捧个场吧希望lz多share。
onsite里面的2,面试官说时间连续,但实际上还是离散的吧,因为输入是离散的?还
是说共有部分要加权,比如【2,4】 是100,【3,5】是200,【3,4】就是150, 而不是
300?
onsite里面的7,是想detect什么异常?如果不是复杂的log,是不是可以直接check
pattern或者hash。 你说的outlier detection,是说要把每行log先转化成feature,
然后把几个常见的pattern设为positive,异常的row作为negative,然后train
classifier吗,?
onsite 1,你是答得learn to rank吗,然后讨论该用什么做label吗? 还是说想
newsfeed design一样人工设定各个权重?
avatar
c*m
9
刚才仔细看了一下你的解答,明白了onsite: 2的意思。忽略我的问题吧。
avatar
x*9
10
Insert, pop, find random有个类似的:
insert,pop min, everything o(1), 有没有思路可以借鉴?感觉理论上最少logN啊

攒人品了~电面:1. 给一个矩阵如下:a b c de f g hi j k lm n o p要求按如下方式
打印:a f k pb g lc hde j oi n m2. 设计........

【在 d******p 的大作中提到】
: 补充一下:
: P家感觉亚裔很多,印度人很少,赞一下。据里面的人说,除了coding以外,还比较注
: 重culture fit,communication什么的比较重要吧。考题涉及design的也挺多,最好在
: 面试前熟悉一下他们的pin,board之类。

avatar
D*d
11
这些题真心不难啊,可惜它连个 phone interview 也不给。
avatar
c*p
12
mark
avatar
s*n
13
版上p家棉经真少,mark一下
店面2,上门1还真需要喜欢这个公司,研究过产品才能答得好
avatar
c*p
14
mark
avatar
m*i
15
zan
avatar
x*0
16
m
avatar
x*9
17
楼主能不能多说说outlier exception 怎么用到log exception 上啊
avatar
l*5
18
谢谢分享!
avatar
f*t
19
赞印度人少
avatar
j*x
20
这年头没内推 闪金光的简历想拿pinterest面试?。。。

【在 D**********d 的大作中提到】
: 这些题真心不难啊,可惜它连个 phone interview 也不给。
avatar
h*8
21
二爷就在pin的吧!
avatar
l*a
22
mark
avatar
j*g
23
楼主面的是什么职位啊?
感觉问题和ads有关啊
avatar
b*r
24
谢谢楼主!
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。