这道google面经体咋做 - 未名空间MITBBS历史存档

国际科技财经博客移民网络热点娱乐民生时事公众号

Redian新闻

>未名空间

>JobHunting - 待字闺中

这道google面经体咋做

这道google面经体咋做# JobHunting - 待字闺中

y*d2016-12-15 08:12

1 楼

一个set里面有a，b，c等若干个char，设计random函数，得到某个char的概率和它
的出现次数成正比。

i*t2016-12-15 08:12

2 楼

编程题还是统计概率题。。。

【在 y*******d 的大作中提到】

: 一个set里面有a，b，c等若干个char，设计random函数，得到某个char的概率和它
: 的出现次数成正比。

y*d2016-12-15 08:12

3 楼

编程
估计是design

【在 i******t 的大作中提到】

: 编程题还是统计概率题。。。

i*t2016-12-15 08:12

4 楼

Dirichlet-multinomial distribution?

【在 y*******d 的大作中提到】

: 编程
: 估计是design

y*d2016-12-15 08:12

5 楼

不懂这是啥啊
有code么

【在 i******t 的大作中提到】

: Dirichlet-multinomial distribution?

e*s2016-12-15 08:12

6 楼

weighted reservoir sampling?

【在 y*******d 的大作中提到】

: 一个set里面有a，b，c等若干个char，设计random函数，得到某个char的概率和它
: 的出现次数成正比。

m*n2016-12-15 08:12

7 楼

虽然算法垃圾一点，但是work的。
def test(data):
dataset = [[n, data.count(n)] for n in set(data)]
for i in xrange(2):
copydataset = copy.deepcopy(dataset)
print list(generator(copydataset))
print '\n'

def generator(dataset):
size = len(dataset)
while dataset:
index = int(random.random()*size)
dataset[index][1] -= 1
char = dataset[index][0]
if not dataset[index][1]:
dataset.pop(index)
size = size - 1
yield char

m*a2016-12-15 08:12

8 楼

Add data to array, return a random index.
public char randomChar(){
List data = new ArrayList<>();
data.add('a');data.add('b');data.add('a')....
return data.get(new Random().nextInt(data.size()));
}

【在 y*******d 的大作中提到】

: 一个set里面有a，b，c等若干个char，设计random函数，得到某个char的概率和它
: 的出现次数成正比。

M*x2016-12-15 08:12

9 楼

Reservoir Sampling?

z*62016-12-15 08:12

10 楼

freq总和，random（0，freq）之后得数字map回char就好了啊。reservoir sampling是
用于linkedlist而不知道总长度用的

m*n2016-12-15 08:12

11 楼

要是追问，数据太大内存放不下怎么办。Google会出这么简单的题？其实这是一个云计
算题。

r*y2016-12-15 08:12

12 楼

这个解法一旦被问有billion怎么办就成屎了，提示input是char不是string，一共就
256个char

【在 m*********a 的大作中提到】

: Add data to array, return a random index.
: public char randomChar(){
: List data = new ArrayList<>();
: data.add('a');data.add('b');data.add('a')....
: return data.get(new Random().nextInt(data.size()));
: }

c*t2016-12-15 08:12

13 楼

同意，因为char数量有限，数字map回char的时候可以iterate chars one by one

【在 z*****6 的大作中提到】

: freq总和，random（0，freq）之后得数字map回char就好了啊。reservoir sampling是
: 用于linkedlist而不知道总长度用的

h*c2016-12-15 08:12

14 楼

一开始出现次数是0，概率是0，啥也不出现，成正比，概率返回条件是0.

h*c2016-12-15 08:12

15 楼

觉得这是个behav题。

k*a2016-12-15 08:12

16 楼

扫描set，将字符出现频率排序, 然后做一个frequency data的数组，
[{0.0, 0.3, a}, {0.3, 0.5, b}, {0.5, 0.6, c}, {0.6, 0.7, d}, ....]
然后随机产生0-1的浮点数，然后找个数组扫。数组最大是256个items
有点无脑？
不知道follow up是什么样子