Redian新闻
>
这是一种菌类吗?还是一种兰花?
avatar
这是一种菌类吗?还是一种兰花?# gardening - 拈花惹草
d*p
1
一共两次电面一次onsite
电面1. 印度人:
1. research相关问题
2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external
sort就可以了
3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么
放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
最后一个球是红色的概率是多少
电面2. 欧洲人:
1. research相关
2. 和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。基本上
达到hash就差不多对了。会不断问细节,然后如何改进。这轮面的很好。
onsite记得的题目如下:
1. 国人大哥
twitter怎么做fraud detection,怎么根据tweet做clustering,问了一些IR的问题
2. 南美人
自己最满意的项目是什么,又按照简历问了一些问题
怎么找hot的tag(就是#tag这种)
3. 白人
1
1 2 1
1 3 3 1
1 4 6 4 1
给上面这组数列,怎么打印,怎么improve,只给生成一个数组,不难。
4. 和印度人吃饭
5. team lead
悲剧就悲剧在他身上了,问了一个电面一样的问题,我说问过了,换一个吧,然后就换
了一个,结果答的比较烂:
给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近
小抱怨一下,onsite完了hr说要电话讨论一下next step,结果放了我四次鸽子,拖了
一个月,告诉我被拒了,不太厚道。
avatar
y*2
2
在后院大树下发现的,很奇怪,杆子挺硬的,折断时感觉脆脆的,断面有一种滑滑的粘
液,花朵那有一种特有的花香,有点像兰花的味道,没有根,但基部有一团东西,说不
上来像什么,可能像养兰花的藻类。想好好研究一下,于是大卸八块,反而糊涂了,它
到底是什么呢?
挖出来种在花盆里了 :)
avatar
i*6
3
慎言啊,我也被这么搞过。
和电面问到同一个设计题了,都答完了,自己犯贱,说已经被问过。结果那个人马上说
,其实还是有很多不同的,比如我们的环境是...约束是...背景是...你刚才那个答案
不完善的,再想想。然后我就傻眼了...然后就没有然后了...
avatar
x*2
4
真有发现的眼睛,还有一棵童心。赞!! --LOL
avatar
S*w
5
肯定不能说做过了啊
说不定人家就准备了这一道题 你说做过了
让人家怎么办。。。。

【在 i*******6 的大作中提到】
: 慎言啊,我也被这么搞过。
: 和电面问到同一个设计题了,都答完了,自己犯贱,说已经被问过。结果那个人马上说
: ,其实还是有很多不同的,比如我们的环境是...约束是...背景是...你刚才那个答案
: 不完善的,再想想。然后我就傻眼了...然后就没有然后了...

avatar
b*g
6
太神奇了,一定要搞清楚是什么啊
avatar
H*e
7
我也发生过类似的
一个面试的问我一个以前我见过的题目,只要知道trick就秒杀的那种,我说我见过,
然后他就换了一个巨难的,然后被搞了
以后不会这样说了

【在 i*******6 的大作中提到】
: 慎言啊,我也被这么搞过。
: 和电面问到同一个设计题了,都答完了,自己犯贱,说已经被问过。结果那个人马上说
: ,其实还是有很多不同的,比如我们的环境是...约束是...背景是...你刚才那个答案
: 不完善的,再想想。然后我就傻眼了...然后就没有然后了...

avatar
f*y
8
这个我以前也看到过,开完花后就腐烂了,不是绿色植物,像是菌类。。。
avatar
d*o
9
嗯,那样子正常人的反应就是要看看你到底有多NB。
换一道他觉得特别难的题给你。

【在 S*******w 的大作中提到】
: 肯定不能说做过了啊
: 说不定人家就准备了这一道题 你说做过了
: 让人家怎么办。。。。

avatar
y*2
10
没有根,那就肯定不是花,对吧?可是它又有花苞,会开花,花中似乎长着花蕊,太神
奇了! 😄

【在 x******2 的大作中提到】
: 真有发现的眼睛,还有一棵童心。赞!! --LOL
avatar
l*a
11

只有 只有一个红球的时候才会有这种可能把。
二个以上红球不能
没有红球也不能

【在 d******p 的大作中提到】
: 一共两次电面一次onsite
: 电面1. 印度人:
: 1. research相关问题
: 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external
: sort就可以了
: 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么
: 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
: 最后一个球是红色的概率是多少
: 电面2. 欧洲人:
: 1. research相关

avatar
z*e
12
真好看!应该是某种真菌吧~
avatar
d*p
13
一共两次电面一次onsite
电面1. 印度人:
1. research相关问题
2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external
sort就可以了
3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么
放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
最后一个球是红色的概率是多少
电面2. 欧洲人:
1. research相关
2. 和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。基本上
达到hash就差不多对了。会不断问细节,然后如何改进。这轮面的很好。
onsite记得的题目如下:
1. 国人大哥
twitter怎么做fraud detection,怎么根据tweet做clustering,问了一些IR的问题
2. 南美人
自己最满意的项目是什么,又按照简历问了一些问题
怎么找hot的tag(就是#tag这种)
3. 白人
1
1 2 1
1 3 3 1
1 4 6 4 1
给上面这组数列,怎么打印,怎么improve,只给生成一个数组,不难。
4. 和印度人吃饭
5. team lead
悲剧就悲剧在他身上了,问了一个电面一样的问题,我说问过了,换一个吧,然后就换
了一个,结果答的比较烂:
给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近
小抱怨一下,onsite完了hr说要电话讨论一下next step,结果放了我四次鸽子,拖了
一个月,告诉我被拒了,不太厚道。
avatar
y*2
14
是啊!等版上专家解答 😄

【在 b*******g 的大作中提到】
: 太神奇了,一定要搞清楚是什么啊
avatar
g*e
15
概率题没看懂。。。
“twitter的follow关系”是对每个pair当key么?那样这个hashtable不是一般的大了
最后一题是拨电话求可能的对应字符串的翻版吧,suffix tree?代码很难写

【在 d******p 的大作中提到】
: 一共两次电面一次onsite
: 电面1. 印度人:
: 1. research相关问题
: 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external
: sort就可以了
: 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么
: 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
: 最后一个球是红色的概率是多少
: 电面2. 欧洲人:
: 1. research相关

avatar
y*2
16
嗯!我也偏向这个说法,但是菌类会长一个柱头和花蕊,好奇怪也 😄

【在 f******y 的大作中提到】
: 这个我以前也看到过,开完花后就腐烂了,不是绿色植物,像是菌类。。。
avatar
w*x
17

大牛最近在面推特?? 给漏点面经???

【在 g*****e 的大作中提到】
: 概率题没看懂。。。
: “twitter的follow关系”是对每个pair当key么?那样这个hashtable不是一般的大了
: 最后一题是拨电话求可能的对应字符串的翻版吧,suffix tree?代码很难写

avatar
y*2
18
嗯!我觉得60%像菌类 😄

【在 z*****e 的大作中提到】
: 真好看!应该是某种真菌吧~
avatar
c*t
19
没太想明白数组打印那题啊, 过了14641之后下一行怎么推出来呢?
avatar
T*m
20
很巧啊!我刚好认识这个,呵呵。这是一种寄生植物,叫Indian pipe或者叫ghost
plant。
avatar
g*e
21
没,刚找了朋友refer而已。。。

【在 w****x 的大作中提到】
:
: 大牛最近在面推特?? 给漏点面经???

avatar
y*2
22
牛人牛人!太佩服了!我刚刚去网上google了一下,发现它有轻微毒性,今天徒手操作
半天,不会有事吧?
还查到印第安人用它的汁治眼睛感染,它还可以治神经系统方面的毛病,比如癫痫,痉
挛等。
谢谢你,游教授!😄

【在 T*******m 的大作中提到】
: 很巧啊!我刚好认识这个,呵呵。这是一种寄生植物,叫Indian pipe或者叫ghost
: plant。

avatar
g*e
23
C(m,n)啊

【在 g*****e 的大作中提到】
: 没,刚找了朋友refer而已。。。
avatar
y*2
24
大包子谢谢!😄

【在 T*******m 的大作中提到】
: 很巧啊!我刚好认识这个,呵呵。这是一种寄生植物,叫Indian pipe或者叫ghost
: plant。

avatar
p*2
25

杨辉三角

【在 c******t 的大作中提到】
: 没太想明白数组打印那题啊, 过了14641之后下一行怎么推出来呢?
avatar
T*m
26
这个植物其实很漂亮的,呵呵。还有红颜色的类似的寄生植物。
什么牛人,这是叫兽瞎猫碰到死老鼠而已,哈哈。

【在 y****2 的大作中提到】
: 牛人牛人!太佩服了!我刚刚去网上google了一下,发现它有轻微毒性,今天徒手操作
: 半天,不会有事吧?
: 还查到印第安人用它的汁治眼睛感染,它还可以治神经系统方面的毛病,比如癫痫,痉
: 挛等。
: 谢谢你,游教授!😄

avatar
c*t
27
只用一个数组的话,是不是把上一组数组长度+1, 然后将上一组数从后到前计算一遍存
入同数组。
然后再过一遍数组打印?
用java写,没法增加数组长度怎么办?

【在 p*****2 的大作中提到】
:
: 杨辉三角

avatar
y*2
28
游老师太骄傲了! 一一秋实

【在 T*******m 的大作中提到】
: 这个植物其实很漂亮的,呵呵。还有红颜色的类似的寄生植物。
: 什么牛人,这是叫兽瞎猫碰到死老鼠而已,哈哈。

avatar
p*2
29

一个数组应该够了。装得下。

【在 c********t 的大作中提到】
: 只用一个数组的话,是不是把上一组数组长度+1, 然后将上一组数从后到前计算一遍存
: 入同数组。
: 然后再过一遍数组打印?
: 用java写,没法增加数组长度怎么办?

avatar
R*m
30
我怀疑还是不是有你不认识的植物。。。

【在 T*******m 的大作中提到】
: 很巧啊!我刚好认识这个,呵呵。这是一种寄生植物,叫Indian pipe或者叫ghost
: plant。

avatar
l*a
31
ArrayList

【在 c********t 的大作中提到】
: 只用一个数组的话,是不是把上一组数组长度+1, 然后将上一组数从后到前计算一遍存
: 入同数组。
: 然后再过一遍数组打印?
: 用java写,没法增加数组长度怎么办?

avatar
G*a
32
同怀疑!

【在 R*******m 的大作中提到】
: 我怀疑还是不是有你不认识的植物。。。
avatar
w*x
33
"和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。"
struct EDGE
{
int x;
int y;
EDGE(int a, int b) : x(a), y(b) {}
};
void _inner_find_comp(int x, hash_map>& mp, set& st,
vector& vecComp);
void _insert_conn(int x, int y, hash_map>& mp);
void GetConnectedComp(vector& edges, vector>& comps)
{
hash_map> mp;
for (vector::iterator it = edges.begin(); it != edges.end(); it++)
{
_insert_conn(it->x, it->y, mp);
_insert_conn(it->y, it->x, mp);
}
set st;
for (hash_map>::iterator it = mp.begin(); it != mp.end();
it++)
{
int x = it->first;
if (st.find(x) == st.end())
{
vector vecTmp;
_inner_find_comp(x, mp, st, vecTmp);
comps.push_back(vecTmp);
}
}
}
void _inner_find_comp(int x, hash_map>& mp, set& st,
vector& vecComp)
{
if (st.find(x) != st.end() || mp.find(x) == mp.end())
return;
st.insert(x);
vecComp.push_back(x);
set& cons = mp[x];
for (set::iterator it = cons.begin(); it != cons.end(); it++)
_inner_find_comp(*it, mp, st, vecComp);
}
void _insert_conn(int x, int y, hash_map>& mp)
{
if (mp.find(x) == mp.end())
{
set setTmp;
mp[x] = setTmp;
}
mp[x].insert(y);
}
avatar
G*a
34
看着挺好玩儿的!

【在 y****2 的大作中提到】
: 在后院大树下发现的,很奇怪,杆子挺硬的,折断时感觉脆脆的,断面有一种滑滑的粘
: 液,花朵那有一种特有的花香,有点像兰花的味道,没有根,但基部有一团东西,说不
: 上来像什么,可能像养兰花的藻类。想好好研究一下,于是大卸八块,反而糊涂了,它
: 到底是什么呢?
: 挖出来种在花盆里了 :)

avatar
w*x
35
/*
Given tweet's inverted index,how to find phrases combination,e.g
phrase "twitter good tool", "twitter is a good tool" is better than "twitter
is good,
facebook is a better tool"
*/
bool GetClosestPhrase(hash_map>& dic, vector& strs,
int& nStart, int& nEnd)
{
for (vector::iterator it = strs.begin(); it != strs.end(); it++)
{
if (dic.find(*it) == dic.end())
return false;
}
int nNum = strs.size();
vector*> vec;
vector vecIndex;
for (int i = 0; i < nNum; i++)
{
vec.push_back(&dic[strs[i]]);
vecIndex.push_back(0);
}
nStart = -1;
nEnd = -1;
for (int i = 0; i < vec[0]->size(); i++)
{
vecIndex[0] = i;
int nPrev = vec[0]->at(vecIndex[0]);
for (int j = 1; j < nNum; j++)
{
int iter = vecIndex[j];
while (iter < vec[j]->size() && vec[j]->at(iter) <= nPrev)
iter++;
if (iter >= vec[j]->size())
return nStart >= 0;
vecIndex[j] = iter;
nPrev = vec[j]->at(iter);
}
if (nStart < 0 || nEnd - nStart >
vec[nNum-1]->at(vecIndex[nNum-1]) - vec[0]->at(vecIndex[0]))
{
nEnd = vec[nNum-1]->at(vecIndex[nNum-1]);
nStart = vec[0]->at(vecIndex[0]);
}
}
return nStart >= 0;
}
avatar
u*u
36
我不完全认为是菌。你们再观察,如果是植物的话,就应该生长一段时间。如果是菌的
话,几天之后就会死。至于那个长得象花的东东可能是均的胞子。

【在 y****2 的大作中提到】
: 牛人牛人!太佩服了!我刚刚去网上google了一下,发现它有轻微毒性,今天徒手操作
: 半天,不会有事吧?
: 还查到印第安人用它的汁治眼睛感染,它还可以治神经系统方面的毛病,比如癫痫,痉
: 挛等。
: 谢谢你,游教授!😄

avatar
g*e
37
概率题没看懂。。。
“twitter的follow关系”是对每个pair当key么?那样这个hashtable不是一般的大了
最后一题是拨电话求可能的对应字符串的翻版吧,suffix tree?代码很难写

【在 d******p 的大作中提到】
: 一共两次电面一次onsite
: 电面1. 印度人:
: 1. research相关问题
: 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external
: sort就可以了
: 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么
: 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
: 最后一个球是红色的概率是多少
: 电面2. 欧洲人:
: 1. research相关

avatar
a*u
38
寄生植物,之前专门google过

【在 y****2 的大作中提到】
: 在后院大树下发现的,很奇怪,杆子挺硬的,折断时感觉脆脆的,断面有一种滑滑的粘
: 液,花朵那有一种特有的花香,有点像兰花的味道,没有根,但基部有一团东西,说不
: 上来像什么,可能像养兰花的藻类。想好好研究一下,于是大卸八块,反而糊涂了,它
: 到底是什么呢?
: 挖出来种在花盆里了 :)

avatar
w*x
39

大牛最近在面推特?? 给漏点面经???

【在 g*****e 的大作中提到】
: 概率题没看懂。。。
: “twitter的follow关系”是对每个pair当key么?那样这个hashtable不是一般的大了
: 最后一题是拨电话求可能的对应字符串的翻版吧,suffix tree?代码很难写

avatar
c*t
40
没太想明白数组打印那题啊, 过了14641之后下一行怎么推出来呢?
avatar
g*e
41
没,刚找了朋友refer而已。。。

【在 w****x 的大作中提到】
:
: 大牛最近在面推特?? 给漏点面经???

avatar
g*e
42
C(m,n)啊

【在 g*****e 的大作中提到】
: 没,刚找了朋友refer而已。。。
avatar
p*2
43

杨辉三角

【在 c******t 的大作中提到】
: 没太想明白数组打印那题啊, 过了14641之后下一行怎么推出来呢?
avatar
c*t
44
只用一个数组的话,是不是把上一组数组长度+1, 然后将上一组数从后到前计算一遍存
入同数组。
然后再过一遍数组打印?
用java写,没法增加数组长度怎么办?

【在 p*****2 的大作中提到】
:
: 杨辉三角

avatar
p*2
45

一个数组应该够了。装得下。

【在 c********t 的大作中提到】
: 只用一个数组的话,是不是把上一组数组长度+1, 然后将上一组数从后到前计算一遍存
: 入同数组。
: 然后再过一遍数组打印?
: 用java写,没法增加数组长度怎么办?

avatar
l*a
46
ArrayList

【在 c********t 的大作中提到】
: 只用一个数组的话,是不是把上一组数组长度+1, 然后将上一组数从后到前计算一遍存
: 入同数组。
: 然后再过一遍数组打印?
: 用java写,没法增加数组长度怎么办?

avatar
w*x
47
"和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。"
struct EDGE
{
int x;
int y;
EDGE(int a, int b) : x(a), y(b) {}
};
void _inner_find_comp(int x, hash_map>& mp, set& st,
vector& vecComp);
void _insert_conn(int x, int y, hash_map>& mp);
void GetConnectedComp(vector& edges, vector>& comps)
{
hash_map> mp;
for (vector::iterator it = edges.begin(); it != edges.end(); it++)
{
_insert_conn(it->x, it->y, mp);
_insert_conn(it->y, it->x, mp);
}
set st;
for (hash_map>::iterator it = mp.begin(); it != mp.end();
it++)
{
int x = it->first;
if (st.find(x) == st.end())
{
vector vecTmp;
_inner_find_comp(x, mp, st, vecTmp);
comps.push_back(vecTmp);
}
}
}
void _inner_find_comp(int x, hash_map>& mp, set& st,
vector& vecComp)
{
if (st.find(x) != st.end() || mp.find(x) == mp.end())
return;
st.insert(x);
vecComp.push_back(x);
set& cons = mp[x];
for (set::iterator it = cons.begin(); it != cons.end(); it++)
_inner_find_comp(*it, mp, st, vecComp);
}
void _insert_conn(int x, int y, hash_map>& mp)
{
if (mp.find(x) == mp.end())
{
set setTmp;
mp[x] = setTmp;
}
mp[x].insert(y);
}
avatar
w*x
48
/*
Given tweet's inverted index,how to find phrases combination,e.g
phrase "twitter good tool", "twitter is a good tool" is better than "twitter
is good,
facebook is a better tool"
*/
bool GetClosestPhrase(hash_map>& dic, vector& strs,
int& nStart, int& nEnd)
{
for (vector::iterator it = strs.begin(); it != strs.end(); it++)
{
if (dic.find(*it) == dic.end())
return false;
}
int nNum = strs.size();
vector*> vec;
vector vecIndex;
for (int i = 0; i < nNum; i++)
{
vec.push_back(&dic[strs[i]]);
vecIndex.push_back(0);
}
nStart = -1;
nEnd = -1;
for (int i = 0; i < vec[0]->size(); i++)
{
vecIndex[0] = i;
int nPrev = vec[0]->at(vecIndex[0]);
for (int j = 1; j < nNum; j++)
{
int iter = vecIndex[j];
while (iter < vec[j]->size() && vec[j]->at(iter) <= nPrev)
iter++;
if (iter >= vec[j]->size())
return nStart >= 0;
vecIndex[j] = iter;
nPrev = vec[j]->at(iter);
}
if (nStart < 0 || nEnd - nStart >
vec[nNum-1]->at(vecIndex[nNum-1]) - vec[0]->at(vecIndex[0]))
{
nEnd = vec[nNum-1]->at(vecIndex[nNum-1]);
nStart = vec[0]->at(vecIndex[0]);
}
}
return nStart >= 0;
}
avatar
g*e
49


【在 w****x 的大作中提到】
: "和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
: 有的connected components。有一个很大的文件,每行存一条follow关系的边。"
: struct EDGE
: {
: int x;
: int y;
: EDGE(int a, int b) : x(a), y(b) {}
: };
: void _inner_find_comp(int x, hash_map>& mp, set& st,
: vector& vecComp);

avatar
e*o
50
随能解释一下这个题目么? 什么叫 “找到所有的connected component"? 比较土,没
用过twitter. thanks
2. 和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。基本上
达到hash就差不多对了。会不断问细节,然后如何改进。这轮面的很好。
avatar
m*k
51
5. team lead
悲剧就悲剧在他身上了,问了一个电面一样的问题,我说问过了,换一个吧,然后就换
了一个,结果答的比较烂:
给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近
找最短的包涵所有单词的句子?
顺序重要么?

【在 d******p 的大作中提到】
: 一共两次电面一次onsite
: 电面1. 印度人:
: 1. research相关问题
: 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external
: sort就可以了
: 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么
: 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
: 最后一个球是红色的概率是多少
: 电面2. 欧洲人:
: 1. research相关

avatar
l*b
52
NB, mark
avatar
q*m
53
请问根据下一个花色来判断是否放回, 具体判断规则是什么? 比如拿到蓝色,下一个
是蓝色,放回吗? 下一个是红色,放回吗?
avatar
f*m
54
下面三题的想法:
(1)2. 和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently
找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。基本上
达到hash就差不多对了。会不断问细节,然后如何改进。这轮面的很好。
想法:
通过follow关系给每个用户建立adjacent list,其中存放其followers。这样我们得到
一个graph.然后用bfs 或dfs找出和一个给定用户连接的节点(用户)。
(2) 5. team lead
悲剧就悲剧在他身上了,问了一个电面一样的问题,我说问过了,换一个吧,然后就换
了一个,结果答的比较烂:
给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近
想法:
计算tweet和candidate phrase的“距离”时考虑candidate phrase的长度。太长则“
距离”大。
(3)3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,
那么
放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
最后一个球是红色的概率是多少
想法:
原题是?

【在 d******p 的大作中提到】
: 一共两次电面一次onsite
: 电面1. 印度人:
: 1. research相关问题
: 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external
: sort就可以了
: 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么
: 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
: 最后一个球是红色的概率是多少
: 电面2. 欧洲人:
: 1. research相关

avatar
f*m
55
能说说思路吗?

【在 w****x 的大作中提到】
: "和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
: 有的connected components。有一个很大的文件,每行存一条follow关系的边。"
: struct EDGE
: {
: int x;
: int y;
: EDGE(int a, int b) : x(a), y(b) {}
: };
: void _inner_find_comp(int x, hash_map>& mp, set& st,
: vector& vecComp);

avatar
f*m
56
能说说思路吗?
谢谢。

twitter

【在 w****x 的大作中提到】
: /*
: Given tweet's inverted index,how to find phrases combination,e.g
: phrase "twitter good tool", "twitter is a good tool" is better than "twitter
: is good,
: facebook is a better tool"
: */
: bool GetClosestPhrase(hash_map>& dic, vector& strs,
: int& nStart, int& nEnd)
: {
: for (vector::iterator it = strs.begin(); it != strs.end(); it++)

avatar
g*e
57


【在 w****x 的大作中提到】
: "和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
: 有的connected components。有一个很大的文件,每行存一条follow关系的边。"
: struct EDGE
: {
: int x;
: int y;
: EDGE(int a, int b) : x(a), y(b) {}
: };
: void _inner_find_comp(int x, hash_map>& mp, set& st,
: vector& vecComp);

avatar
e*o
58
随能解释一下这个题目么? 什么叫 “找到所有的connected component"? 比较土,没
用过twitter. thanks
2. 和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。基本上
达到hash就差不多对了。会不断问细节,然后如何改进。这轮面的很好。
avatar
m*k
59
5. team lead
悲剧就悲剧在他身上了,问了一个电面一样的问题,我说问过了,换一个吧,然后就换
了一个,结果答的比较烂:
给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近
找最短的包涵所有单词的句子?
顺序重要么?

【在 d******p 的大作中提到】
: 一共两次电面一次onsite
: 电面1. 印度人:
: 1. research相关问题
: 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external
: sort就可以了
: 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么
: 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
: 最后一个球是红色的概率是多少
: 电面2. 欧洲人:
: 1. research相关

avatar
l*b
60
NB, mark
avatar
q*m
61
请问根据下一个花色来判断是否放回, 具体判断规则是什么? 比如拿到蓝色,下一个
是蓝色,放回吗? 下一个是红色,放回吗?
avatar
f*m
62
下面三题的想法:
(1)2. 和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently
找到所
有的connected components。有一个很大的文件,每行存一条follow关系的边。基本上
达到hash就差不多对了。会不断问细节,然后如何改进。这轮面的很好。
想法:
通过follow关系给每个用户建立adjacent list,其中存放其followers。这样我们得到
一个graph.然后用bfs 或dfs找出和一个给定用户连接的节点(用户)。
(2) 5. team lead
悲剧就悲剧在他身上了,问了一个电面一样的问题,我说问过了,换一个吧,然后就换
了一个,结果答的比较烂:
给一组tweet的inverted index,怎么找一个phrase(多个词)的最短组合,比如找
phrase "twitter good tool", twitter is a good tool就比twitter is good,
facebook is a better tool距离近
想法:
计算tweet和candidate phrase的“距离”时考虑candidate phrase的长度。太长则“
距离”大。
(3)3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,
那么
放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
最后一个球是红色的概率是多少
想法:
原题是?

【在 d******p 的大作中提到】
: 一共两次电面一次onsite
: 电面1. 印度人:
: 1. research相关问题
: 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external
: sort就可以了
: 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么
: 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
: 最后一个球是红色的概率是多少
: 电面2. 欧洲人:
: 1. research相关

avatar
f*m
63
能说说思路吗?

【在 w****x 的大作中提到】
: "和twitter很相关的一个问题,根据twitter的follow关系,如何efficiently找到所
: 有的connected components。有一个很大的文件,每行存一条follow关系的边。"
: struct EDGE
: {
: int x;
: int y;
: EDGE(int a, int b) : x(a), y(b) {}
: };
: void _inner_find_comp(int x, hash_map>& mp, set& st,
: vector& vecComp);

avatar
f*m
64
能说说思路吗?
谢谢。

twitter

【在 w****x 的大作中提到】
: /*
: Given tweet's inverted index,how to find phrases combination,e.g
: phrase "twitter good tool", "twitter is a good tool" is better than "twitter
: is good,
: facebook is a better tool"
: */
: bool GetClosestPhrase(hash_map>& dic, vector& strs,
: int& nStart, int& nEnd)
: {
: for (vector::iterator it = strs.begin(); it != strs.end(); it++)

avatar
y*5
65
感觉T家面试确实比较乱 LZ加油面别家吧
avatar
b*u
66
connected components是考怎样找Strongly connected components吗?

【在 d******p 的大作中提到】
: 一共两次电面一次onsite
: 电面1. 印度人:
: 1. research相关问题
: 2. 给一个巨大的文件(>10GB),每一行都是一个数字,怎么sort。只要答到external
: sort就可以了
: 3. 一个概率题,具体记不清了,大概的意思是有红色和蓝色球,如果拿到红色,那么
: 放回,如果拿到蓝色,再拿下一个,根据下一个的花色来判断是否放回。问:拿到就剩
: 最后一个球是红色的概率是多少
: 电面2. 欧洲人:
: 1. research相关

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。