发几个面经(5) Groupon 电面+onsite - 未名空间MITBBS历史存档

国际科技财经博客移民网络热点娱乐民生时事公众号

Redian新闻

>未名空间

>JobHunting - 待字闺中

发几个面经(5) Groupon 电面+onsite

发几个面经(5) Groupon 电面+onsite# JobHunting - 待字闺中

w*12013-05-28 07:05

1 楼

loser们是不是很失落
Professional Appointment
2010-present Associate Professor, Department of Materials Science and
Engineering, Stanford University
2005-2010 Assistant Professor, Department of Materials Science and
Engineering, Stanford University

s*r2013-05-28 07:05

2 楼

尽管第一个onsite是twitter给的
groupon却是我第一个去onsite的公司过程也是所有面试的公司中最漫长的
面完groupon心态彻底变平和了再面任何其他公司也都不会再觉得折腾了
总共面了 10个人 onsite前两轮电话+ onsite 5个人 + onsite后3轮电话
面试的过程中要去的组因为内部人re-org被强塞了几个人 offer自然也没了
电面
p1 主要面data mining，毕竟宽泛，考察到了
1) measures of classification
2) boundary decision for classification
3) Feature selection
4)Entrophy,TF,IDF
5) coding 给定query 打印出所有match的combination
// Query = dress for less
// Expansion: "dress:[es, ed, ing] for less:(cheap, deal)"
/*
dress for less
dress for cheap
dress for deal
dresses for less
*/
p2
coding题目 Print Binary Tree in Zigzag order
onsite
p1:
1) team introduction/self introducaton/project introduction
2) Coding: Given a user list and a deal, also a api (float relevance(User u,
deal d)), return the k top users that are most related to the deal
p2:
1) indroduction
2) 扔硬币:两个不知道的Head/Tail概率的硬币,扔1000次得500次head VS 扔100次得50
次head，算confidence, p value
3) Given a friend network:
Lan---> micheal
Michael--> Kathy
Lan--->alex
....
Found the following result:
number of person number of friends
3 10
2 4
...
a)how to do this? no need to code.
b)how to do this with Map Reduce
c)how to do this in SQL(count,group by, union)
4) Kmeans的 cost function
p3 lunch guy 算法 Model 设计题
Given a user query(String), how to build a classified model in which it
takes the query and return the most related deal categories?
Training data availabe(Deals info--->categorical info)
p4
1）聊天 project/team
2)coding 题目
Given two set of weather Data
April
City Tempratature huminity
San Jose 50 50
San Fran 40 30
May
San Jose 70 30
Chicago 30 20
Ouput the variation in the following format
San Jose 40% -40%
San Fran infiniti infiniti
Chicago -infiniti -infiniti
p5
1）问project 穿插考察概念
2) unfair 硬币问题
throw 1000 times, 550 times head, what's the probability of p=0.5?
3）算法
give two Arrays A and B (size large)
output T if all element in A are also present in B, otherwise F.
有follow up
4）算法设计题一堆groupon向google买的广告的点击和收费记录
如何设计算法获取单个词条的收费rate
Problem
words # of clicks TotalPaid Amt to google each day ,
w1, 320
w2, 250
w3, 5
w4, 230
......
how to get the rate for each word?
提出解法后有follow up questions.
onstie后recruiter反应feedback很好要时间说Hiring manager要电话讨论role
availability，放松警惕了随便给了个时间也没准备电脑网络耳机什么的结果HM打来
电话是技术面，让coding的时候一下慌了没面好，于是给recruiter发信解释，又加了
两轮面试(recruiter说是一轮技术面，一轮介绍产品的，后来证明又是两轮技术面，
groupon的内部沟通确实有些问题) 虽然后面coding写的都还可以但这个过程中其实
position已经没了
onsite后电面
p1
1) design question, big data/hash table related
2) coding
Given
"ABBEEFG" and pattern "BE"
a) remove pattern from string
return "ABEFG"
b) recursive remove pattern
return "AFG"
p2
dp题，给定钱数和所有的可能硬币面值，求最少的硬币数目的组合
p3
问了很多personal questions 略过不表
技术有关题目
1)How to improve an existing algorithm?
follow up给出了目前groupon 推荐deal的算法，如何优化
2）coding题目:给出二叉树，打印从 root到leaf的所有可能路径

c*a2013-05-28 07:05

3 楼

靠，groupon这么难！

g*r2013-05-28 07:05

4 楼

谢谢分享

A*o2013-05-28 07:05

5 楼

这家够乱的，让我onsite，机票都忘了给我定

f*a2013-05-28 07:05

6 楼

这家电面完是默剧？都4周了，催了一次，连个邮件都木有。

【在 A***o 的大作中提到】

: 这家够乱的，让我onsite，机票都忘了给我定

A*o2013-05-28 07:05

7 楼

好像是一周内告诉我了onsite了

【在 f********a 的大作中提到】

: 这家电面完是默剧？都4周了，催了一次，连个邮件都木有。

s*r2013-05-28 07:05

8 楼

他家内部communication确实不太好...

【在 A***o 的大作中提到】

: 这家够乱的，让我onsite，机票都忘了给我定

A*o2013-05-28 07:05

9 楼

那题toss 1000, 550 head, 求p=0.5 概率。用贝叶斯吗？

【在 s*******r 的大作中提到】

: 他家内部communication确实不太好...

s*r2013-05-28 07:05

10 楼

p value之类的东西吧
这个我告诉面试官说我知道统计学里有公式可以求但我不知道具体的公式

【在 A***o 的大作中提到】

: 那题toss 1000, 550 head, 求p=0.5 概率。用贝叶斯吗？

p*i2013-05-28 07:05

11 楼

这题是用Binomial test

【在 s*******r 的大作中提到】

: p value之类的东西吧
: 这个我告诉面试官说我知道统计学里有公式可以求但我不知道具体的公式

x*B2013-05-28 07:05

12 楼

您是new graduate吗？这也太广泛了。问的。

【在 s*******r 的大作中提到】

: 尽管第一个onsite是twitter给的
: groupon却是我第一个去onsite的公司过程也是所有面试的公司中最漫长的
: 面完groupon心态彻底变平和了再面任何其他公司也都不会再觉得折腾了
: 总共面了 10个人 onsite前两轮电话+ onsite 5个人 + onsite后3轮电话
: 面试的过程中要去的组因为内部人re-org被强塞了几个人 offer自然也没了
: 电面
: p1 主要面data mining，毕竟宽泛，考察到了
: 1) measures of classification
: 2) boundary decision for classification
: 3) Feature selection

f*m2013-05-28 07:05

13 楼

这题我也怎么感觉要用bayes，不过prior之类的还得好好想想。大家有何思路？

【在 A***o 的大作中提到】

: 那题toss 1000, 550 head, 求p=0.5 概率。用贝叶斯吗？

f*m2013-05-28 07:05

14 楼

楼主能详细说说吗？谢谢。

【在 s*******r 的大作中提到】

: p value之类的东西吧
: 这个我告诉面试官说我知道统计学里有公式可以求但我不知道具体的公式

f*m2013-05-28 07:05

15 楼

楼主能说说这个题吗？
2) 扔硬币:两个不知道的Head/Tail概率的硬币,扔1000次得500次head VS 扔100次得50
次head，算confidence, p value
多谢。

【在 s*******r 的大作中提到】

p*i2013-05-28 07:05

16 楼

有人问我就回答在这里了
一个硬币，无论fair与否，假设它扔一次得到head的概率是p，那么扔N次得到head的次
数和x服从Binomial Distribution B(N,p),期望是E(x)=N*p, 方差是Var(x)=N*p*(1-p)
，在大样本的时候Binomial Distribution可以近似为均值N*p,方差N*p*(1-p)的Normal
Distribution。Confidence Interval等等有公式，就不贴在这里了，如果用Normal
Dist近似的话95% confidence interval就是 Np +/- 1.96 * sqrt(Np(1-p))
而相对应的就是，拿到一个样本，N次head向上有x次，检验这个硬币扔一次出head的概
率p是不是等于某个预计值p0，就是Binomial Test. 这里有个网页介绍，还可以在线计
算（其实公式也很简单）：
http://www.quantitativeskills.com/sisa/distributions/binohlp.ht
楼主提到的那个1000次出了550次head，p0=0.5的例子，结果是这个：
http://www.quantitativeskills.com/sisa/distributions/binomial.p
可以看到这样的硬币已经是相当unfair的了，pvalue是 p(>550): 0.000696

50

【在 f*********m 的大作中提到】

: 楼主能说说这个题吗？
: 2) 扔硬币:两个不知道的Head/Tail概率的硬币,扔1000次得500次head VS 扔100次得50
: 次head，算confidence, p value
: 多谢。

p*i2013-05-28 07:05

17 楼

Bayesian也可以做这个，不过意义略有不同， Bayesian可以假设Prior是p=0.5,然后根
据Observed data算出Posterior p的分布，R或者OPENBUGS写个小程序就可以模拟一下
，呵呵，估计做出来的分布也是远离0.5的了

p)
Normal

【在 p*******i 的大作中提到】

: 有人问我就回答在这里了
: 一个硬币，无论fair与否，假设它扔一次得到head的概率是p，那么扔N次得到head的次
: 数和x服从Binomial Distribution B(N,p),期望是E(x)=N*p, 方差是Var(x)=N*p*(1-p)
: ，在大样本的时候Binomial Distribution可以近似为均值N*p,方差N*p*(1-p)的Normal
: Distribution。Confidence Interval等等有公式，就不贴在这里了，如果用Normal
: Dist近似的话95% confidence interval就是 Np +/- 1.96 * sqrt(Np(1-p))
: 而相对应的就是，拿到一个样本，N次head向上有x次，检验这个硬币扔一次出head的概
: 率p是不是等于某个预计值p0，就是Binomial Test. 这里有个网页介绍，还可以在线计
: 算（其实公式也很简单）：
: http://www.quantitativeskills.com/sisa/distributions/binohlp.ht

s*r2013-05-28 07:05

18 楼

多谢解答啊

p)
Normal

【在 p*******i 的大作中提到】

c*n2013-05-28 07:05

19 楼

Ft who would go to groupon
?
That company is sure going dead

【在 s*******r 的大作中提到】

f*m2013-05-28 07:05

20 楼

Bayes是不是这样？
P(p=0.5|toss 1000, 550 head)=P(toss 1000, 550 head|p=0.5)*P(p=0.5)/ P(toss
1000, 550 head)
P(toss 1000, 550 head|p=0.5)是p=0.5时的贝努力，那么P(p=0.5)和P(toss 1000,
550 head)怎么算呢？
P(p=0.5)难道当p=0.5时等于1，其他情况等于0吗？

【在 p*******i 的大作中提到】

: Bayesian也可以做这个，不过意义略有不同， Bayesian可以假设Prior是p=0.5,然后根
: 据Observed data算出Posterior p的分布，R或者OPENBUGS写个小程序就可以模拟一下
: ，呵呵，估计做出来的分布也是远离0.5的了
:
: p)
: Normal