Redian新闻
>
发一个MSFT bing的onsite面经
avatar
发一个MSFT bing的onsite面经# JobHunting - 待字闺中
l*0
1
一轮店面:
1. how to efficiently get all the email address from a page
2. normalized directory without using stack
/a/b/c/.././ -> /a/b
onsite 四轮
1. 国人大哥
a. 怎么实现相关搜索,例如,我搜索 Bush, 相关搜索应该会显示president,
bill clinton等等.
b. 一个fair的coin怎么产生unfair的head/tail 分布
c. 生男生女的概率经典问题.
2. 东欧人
a. process和thread区别
b. 什么是critical section. 什么是mutex,和semaphore的区别。如何设计一个
lock。
c. 怎么判断操作系统的stack的地址是递增还是递减的。
d. coding: Binary tree的width.(经典题)
3.
a. 两个n-ary tree. 找到相同的最大子树(经典题)
b. 增强版本: 如果当前level的node是 a c b d 和 a b c 必须要顺序相同的
match节点。怎么做。 这个例子中就是要么match ab要么match a, c以及他们的子树。
c. NLP相关的问题。如果有很多个同名的Clinton怎么cluster到不同的group
4.
a. 从袋子里每次拿两个球,如果告诉你一次拿到两个蓝色球的概率是50%,估计袋子中一共有多
少球。
b. 字符串分词,一列单词之间没有空格,怎么样划分(经典题)
e.g. bedbathandbeyond -> bed bath and beyond
扩展问题是 对于上面例子如何保证得到的是bed bath and beyond 而不是bed
bat hand beyond?
整体感觉设计题偏多,本身不是做DM或者IE,NLP的,所有感觉设计题应该是全挂了。
avatar
s*n
2
最后一题好难啊,最后见大老板了么?
bless

【在 l*******0 的大作中提到】
: 一轮店面:
: 1. how to efficiently get all the email address from a page
: 2. normalized directory without using stack
: /a/b/c/.././ -> /a/b
: onsite 四轮
: 1. 国人大哥
: a. 怎么实现相关搜索,例如,我搜索 Bush, 相关搜索应该会显示president,
: bill clinton等等.
: b. 一个fair的coin怎么产生unfair的head/tail 分布
: c. 生男生女的概率经典问题.

avatar
f*t
3
赞面经,bless
avatar
s*n
4
Not hard. I was asked by G. Dynamic Programming and store the max number of
words so far.
I did not solve it on the phone.
But others are hard to me. ai~

【在 s*******n 的大作中提到】
: 最后一题好难啊,最后见大老板了么?
: bless

avatar
w*x
5
Bush那个是不是可以每次craw web page 的时候提取key words, 以句子或段落为单位
建立图的连接, 比如句子Bush is a monkey, 提取key words "Bush" & "monkey", 一
个key word是一个node, 这样建立图, 同时按频率设置边的权重. 查找关联的时候先找
到Bush节点, 然后选取Bush节点邻居的权重最大的k个node ...
avatar
l*0
6
当时我说的跟你差不多,我说的是,在parse文档的时候维持一个大小为N的window。
然后把window里的词算作是bush的关联词. 然后按照取Top-K. 面试官不置可否。
不知道对不对。

【在 w****x 的大作中提到】
: Bush那个是不是可以每次craw web page 的时候提取key words, 以句子或段落为单位
: 建立图的连接, 比如句子Bush is a monkey, 提取key words "Bush" & "monkey", 一
: 个key word是一个node, 这样建立图, 同时按频率设置边的权重. 查找关联的时候先找
: 到Bush节点, 然后选取Bush节点邻居的权重最大的k个node ...

avatar
D*g
7
两个蓝色球那题是不是不完整?袋子里的求可能是什么颜色?

【在 l*******0 的大作中提到】
: 一轮店面:
: 1. how to efficiently get all the email address from a page
: 2. normalized directory without using stack
: /a/b/c/.././ -> /a/b
: onsite 四轮
: 1. 国人大哥
: a. 怎么实现相关搜索,例如,我搜索 Bush, 相关搜索应该会显示president,
: bill clinton等等.
: b. 一个fair的coin怎么产生unfair的head/tail 分布
: c. 生男生女的概率经典问题.

avatar
l*0
8

我当时也是这么问面试官的,他说就这些信息。然后要你估计。然后要写方程求有哪些
可能。

【在 D********g 的大作中提到】
: 两个蓝色球那题是不是不完整?袋子里的求可能是什么颜色?
avatar
l*0
9
嗯,其实这个题面试官更关心的扩展的部分。思路其实都是dp的思路。加了一些设计的
味道在里面。

of

【在 s******n 的大作中提到】
: Not hard. I was asked by G. Dynamic Programming and store the max number of
: words so far.
: I did not solve it on the phone.
: But others are hard to me. ai~

avatar
S*N
10
这个很简单
假设X球 里面Y个是篮球
这样
(y/x)*(y-1/x-1)=1/2
例子 比如y=3 x=4
或者当x,y都很大的话
x*x = 2y*y
=>
x = sqrt(2)*y

【在 l*******0 的大作中提到】
: 嗯,其实这个题面试官更关心的扩展的部分。思路其实都是dp的思路。加了一些设计的
: 味道在里面。
:
: of

avatar
w*x
11
每什么coding的题目阿
avatar
m*9
12
Re, Thanks for sharing. Pretty standard NLP/IR design questions.
avatar
h*g
13
mark~
★ Sent from iPhone App: iReader Mitbbs Lite 7.28
avatar
r*g
14
Query log
LDA

【在 w****x 的大作中提到】
: Bush那个是不是可以每次craw web page 的时候提取key words, 以句子或段落为单位
: 建立图的连接, 比如句子Bush is a monkey, 提取key words "Bush" & "monkey", 一
: 个key word是一个node, 这样建立图, 同时按频率设置边的权重. 查找关联的时候先找
: 到Bush节点, 然后选取Bush节点邻居的权重最大的k个node ...

avatar
r*g
15
你不是学NLP的这个也无所谓。
不过一般不这么做。去Bing面试的话看看IR的综述还是很好的。

【在 l*******0 的大作中提到】
: 当时我说的跟你差不多,我说的是,在parse文档的时候维持一个大小为N的window。
: 然后把window里的词算作是bush的关联词. 然后按照取Top-K. 面试官不置可否。
: 不知道对不对。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。