人类已经不能阻止报纸上的广告了 - 未名空间MITBBS历史存档

国际科技财经博客移民网络热点娱乐民生时事公众号

Redian新闻

>未名空间

>Joke - 肚皮舞运动

人类已经不能阻止报纸上的广告了

人类已经不能阻止报纸上的广告了# Joke - 肚皮舞运动

d*w2011-12-02 08:12

1 楼

1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
算时间
2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
基站一样
4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒1/10
到橙汁，问橙汁中的咖啡跟咖啡中的橙汁数量关系
5. 判断有向图中是否有环
6. 如何抽取feature，如何判断2个用户的相似度，维度大（几千）而稀疏（很多缺失
），比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xyz:aas}]
如何把相似的用户聚合，聚类算法？

a*y2011-12-02 08:12

2 楼

case不是很强，1B,实在想早点拿到绿卡，另外一个工作在等着，属于从Engineer跳到
business manager的职位，没绿卡换不了H1B
但是RFE的几率又高，实在是纠结，论统计，不pp大概要多长时间对NSC来说
case：
引用包括中文的50多，英文30多
11片一作，5封推荐信都是chair或者AE的，review大概20个分部在五六个journal里，
program committee3个。

r*e2011-12-02 08:12

3 楼

人类已经不能阻止报纸上的广告了 .jpg

y*t2011-12-02 08:12

4 楼

多谢,
第4题是考什么? 是不是相等? 都是0.9?

C*y2011-12-02 08:12

5 楼

别纠结了，多难受呀，直接上吧

【在 a*******y 的大作中提到】

: case不是很强，1B,实在想早点拿到绿卡，另外一个工作在等着，属于从Engineer跳到
: business manager的职位，没绿卡换不了H1B
: 但是RFE的几率又高，实在是纠结，论统计，不pp大概要多长时间对NSC来说
: case：
: 引用包括中文的50多，英文30多
: 11片一作，5封推荐信都是chair或者AE的，review大概20个分部在五六个journal里，
: program committee3个。

a*e2011-12-02 08:12

6 楼

全球首F 啊，牛！

d*w2011-12-02 08:12

7 楼

是相等，但肯定不是0.9了

【在 y***t 的大作中提到】

: 多谢,
: 第4题是考什么? 是不是相等? 都是0.9?

a*n2011-12-02 08:12

8 楼

seems good for 1B

P*l2011-12-02 08:12

9 楼

...

z*n2011-12-02 08:12

10 楼

第三题没看懂，基站之间不能通信，如何计算平均值？要各个基站算了之后，返回给卫
星中转，再返回地面基站么？卫星也可以有计算能力么

b*r2011-12-02 08:12

11 楼

这背景1A都够了，1B PP也没什么可犹豫的啊

m*i2011-12-02 08:12

12 楼

浪费啊。

t*e2011-12-02 08:12

13 楼

10/11

【在 y***t 的大作中提到】

: 多谢,
: 第4题是考什么? 是不是相等? 都是0.9?

a*y2011-12-02 08:12

14 楼

attorney said my case is borderline case, she does not recommend pp.

d*e2011-12-02 08:12

15 楼

GS5,狗屎？

d*w2011-12-02 08:12

16 楼

卫星和基站都是有计算能力的，可以想象成卫星是内存，基站是磁盘，就是希望最少的
io次数做一些海量数据的统计。
比如算平均值，可以每个基站算个sum跟个数，传给卫星，就知道总共的平均值了

【在 z*****n 的大作中提到】

: 第三题没看懂，基站之间不能通信，如何计算平均值？要各个基站算了之后，返回给卫
: 星中转，再返回地面基站么？卫星也可以有计算能力么

k*62011-12-02 08:12

17 楼

不要害怕，上pp吧，真要是RFE，怎么着都会。还不如早些知道结果。
我的也是律师不推荐pp，我自己坚持，最后有惊无险
祝福你

【在 a*******y 的大作中提到】

: attorney said my case is borderline case, she does not recommend pp.

q*x2011-12-02 08:12

18 楼

面霸呀。

，估
,
10

【在 d********w 的大作中提到】

: 1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
: 算时间
: 2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
: latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
: 3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
: 能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒1/10
: 到橙汁，问橙汁中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

h*y2011-12-02 08:12

19 楼

直接PP,同时在准备两封推荐信，早死(RFE)早脱生。

g*y2011-12-02 08:12

20 楼

dongfei你是职业面试家还是怎么回事? :-)
我怎么看你各种公司，各种稀奇古怪的问题都被问到了。

，估
,
10

【在 d********w 的大作中提到】

a*y2011-12-02 08:12

21 楼

ai, I do not want to die ya

d*y2011-12-02 08:12

22 楼

第四题是1/11

L*t2011-12-02 08:12

23 楼

你什么时候递的啊？

d*y2011-12-02 08:12

24 楼

，估
,
10
1 coffee in orange vs 0.9 orange in coffee

【在 d********w 的大作中提到】

a*y2011-12-02 08:12

25 楼

not yet but in a close state to submit

d*w2011-12-02 08:12

26 楼

其实不用具体算的，可以利用对称性，比如假设有x的橙汁在咖啡中，那么剩下的橙汁
必然是10-x，而总得体积是不变的10，所以在橙汁中的咖啡也一定是x

【在 d******y 的大作中提到】

: 第四题是1/11

L*r2011-12-02 08:12

27 楼

Almost no difference for EB1B.
Check out http://www.mitbbs.com/article_t0/Immigration/32061391.html

d*w2011-12-02 08:12

28 楼

这话说得。
我很累的，好不好，光三藩机场就跑了四趟
面试是在透支我的体力的

【在 g**********y 的大作中提到】

: dongfei你是职业面试家还是怎么回事? :-)
: 我怎么看你各种公司，各种稀奇古怪的问题都被问到了。
:
: ，估
: ,
: 10

s*n2011-12-02 08:12

29 楼

你的背景很强了（对EB1B），PP吧。 Bless

d*y2011-12-02 08:12

30 楼

从体积为11的杯子（10+1）里倒1/10的东西回到9那里，
总和不是10了，是 10.1（9+11/10），
所以相等是不对的。

【在 d********w 的大作中提到】

: 其实不用具体算的，可以利用对称性，比如假设有x的橙汁在咖啡中，那么剩下的橙汁
: 必然是10-x，而总得体积是不变的10，所以在橙汁中的咖啡也一定是x

l*r2011-12-02 08:12

31 楼

Hi, antihoney:
I did have the same experience and worry as you. My case was not very strong
, 21 paper, 18 reviews, 139 citations.
My lawyer recommended me not to PP.
For some reasons, I insisted PP. I submitted my EB1B on 7/5/2011.
I did PP on 8/19/2011. My case was approved on 8/26/2011, only five days.
Therefore, PP will be good choice if you want to know the results earlier.
Esp. for your strong case than me, I will PP.
Good luck for your green card application.
All the best,
Peter

d*w2011-12-02 08:12

32 楼

呵呵，我表达错了，应该是最后两个杯子还是一样的体积

【在 d*****y 的大作中提到】

: 从体积为11的杯子（10+1）里倒1/10的东西回到9那里，
: 总和不是10了，是 10.1（9+11/10），
: 所以相等是不对的。

a*y2011-12-02 08:12

33 楼

我自己也觉得citation少啊

H*12011-12-02 08:12

34 楼

0.090909
1/11

【在 d********w 的大作中提到】

: 是相等，但肯定不是0.9了

y*t2011-12-02 08:12

35 楼

第4，如果把两种不同密度的液体混合，最后的体积不一定是简单的加和。
http://en.wikipedia.org/wiki/Entropy_of_mixing

s*n2011-12-02 08:12

36 楼

第4题1：1啊，假设密度一样
最后杯1：Orange=100/11 coffee=10/11，杯2：Orange=10/11 coffee=100/11

j*x2011-12-02 08:12

37 楼

面霸！

f*22011-12-02 08:12

38 楼

多谢分享

d*w2011-12-02 08:12

39 楼

1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
算时间
2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
基站一样
4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒到橙汁，最后它们体积仍然是10，问橙汁
中的咖啡跟咖啡中的橙汁数量关系
5. 判断有向图中是否有环
6. 如何抽取feature，如何判断2个用户的相似度，维度大（几千）而稀疏（很多缺失
），比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xyz:aas}]
如何把相似的用户聚合，聚类算法？

y*t2011-12-02 08:12

40 楼

多谢,
第4题是考什么? 是不是相等? 都是0.9?

d*w2011-12-02 08:12

41 楼

是相等，但肯定不是0.9了

【在 y***t 的大作中提到】

: 多谢,
: 第4题是考什么? 是不是相等? 都是0.9?

z*n2011-12-02 08:12

42 楼

第三题没看懂，基站之间不能通信，如何计算平均值？要各个基站算了之后，返回给卫
星中转，再返回地面基站么？卫星也可以有计算能力么

t*e2011-12-02 08:12

43 楼

10/11

【在 y***t 的大作中提到】

: 多谢,
: 第4题是考什么? 是不是相等? 都是0.9?

d*w2011-12-02 08:12

44 楼

: 第三题没看懂，基站之间不能通信，如何计算平均值？要各个基站算了之后，返回给卫
: 星中转，再返回地面基站么？卫星也可以有计算能力么

q*x2011-12-02 08:12

45 楼

面霸呀。

，估
,
10

【在 d********w 的大作中提到】

: 1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
: 算时间
: 2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
: latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
: 3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
: 能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒到橙汁，最后它们体积仍然是10，问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

g*y2011-12-02 08:12

46 楼

dongfei你是职业面试家还是怎么回事? :-)
我怎么看你各种公司，各种稀奇古怪的问题都被问到了。

，估
,
10

【在 d********w 的大作中提到】

: 1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
: 算时间
: 2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
: latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
: 3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
: 能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒到橙汁，最后它们体积仍然是10，问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

d*y2011-12-02 08:12

47 楼

第四题是1/11

d*y2011-12-02 08:12

48 楼

，估
,
10
1 coffee in orange vs 0.9 orange in coffee

【在 d********w 的大作中提到】

: 1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
: 算时间
: 2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
: latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
: 3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
: 能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒到橙汁，最后它们体积仍然是10，问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

d*w2011-12-02 08:12

49 楼

: 第四题是1/11

d*w2011-12-02 08:12

50 楼

这话说得。
我很累的，好不好，光三藩机场就跑了四趟
面试是在透支我的体力的

【在 g**********y 的大作中提到】

: dongfei你是职业面试家还是怎么回事? :-)
: 我怎么看你各种公司，各种稀奇古怪的问题都被问到了。
:
: ，估
: ,
: 10

d*y2011-12-02 08:12

51 楼

从体积为11的杯子（10+1）里倒1/10的东西回到9那里，
总和不是10了，是 10.1（9+11/10），
所以相等是不对的。

【在 d********w 的大作中提到】

d*w2011-12-02 08:12

52 楼

呵呵，我表达错了，应该是最后两个杯子还是一样的体积

【在 d*****y 的大作中提到】

: 从体积为11的杯子（10+1）里倒1/10的东西回到9那里，
: 总和不是10了，是 10.1（9+11/10），
: 所以相等是不对的。

H*12011-12-02 08:12

53 楼

0.090909
1/11

【在 d********w 的大作中提到】

: 是相等，但肯定不是0.9了

y*t2011-12-02 08:12

54 楼

第4，如果把两种不同密度的液体混合，最后的体积不一定是简单的加和。
http://en.wikipedia.org/wiki/Entropy_of_mixing

s*n2011-12-02 08:12

55 楼

第4题1：1啊，假设密度一样
最后杯1：Orange=100/11 coffee=10/11，杯2：Orange=10/11 coffee=100/11

j*x2011-12-02 08:12

56 楼

面霸！

f*22011-12-02 08:12

57 楼

多谢分享

g*e2011-12-02 08:12

58 楼

1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
算时间
－－典型的大数据内存放不下排序，merge sort／external sort。可以探讨下cache的
优化，减少read fault
2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
－－对纪录先排序，用stack合并有重叠的，然后hash。因为ip addr其实就是个32bit
int，所以一般的机器内存也够了。
3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
基站一样
－－卫星理解成mem，基站为harddrive，分块load data。归结到多个sort array找
median，经典写起来麻烦题～
4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒到橙
汁，最后它们体积仍然是10，问橙汁中的咖啡跟咖啡中的橙汁数量关系
－－大家已经讨论了
5. 判断有向图中是否有环
－－看书就可以了
6. 如何抽取feature，如何判断2个用户的相似度，维度大（几千）而稀疏（很多缺失
），比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xyz:aas}]
－－这个是machine learning啊，不断调各个vector的权重。具体计算可以是edit
distance。我想非ML方向的扯不了太深的。。。
大家再讨论讨论？

，估
,
橙汁，最后它们体积仍然是10，问橙汁

【在 d********w 的大作中提到】

: 1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
: 算时间
: 2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
: latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
: 3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
: 能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒到橙汁，最后它们体积仍然是10，问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

l*a2011-12-02 08:12

59 楼

，估
需要用到parallel quick sorthttp://www.uio.no/studier/emner/matnat/ifi/INF3380/v10/undervisningsmateriale/inf3380-week12.pdf。
一百台机子，10T * 100 = 1PB.
第一步，本地排序。用external sort。
第二步，partition/merge between machines。一共需要传log100次。
所有步骤都是disk io bound。

【在 d********w 的大作中提到】

: 1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
: 算时间
: 2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
: latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
: 3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
: 能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒到橙汁，最后它们体积仍然是10，问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

g*e2011-12-02 08:12

60 楼

dongfeiwww你好，
想请教一道具体的题目，是否方便。第一题。这样的题目以你的经历，需要写成map
reduce pseudo code，还是典型的merge sort/external sort即可？多谢

，估
,
橙汁，最后它们体积仍然是10，问橙汁

【在 d********w 的大作中提到】

: 1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
: 算时间
: 2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
: latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
: 3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
: 能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒到橙汁，最后它们体积仍然是10，问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

g*e2011-12-02 08:12

61 楼

: 1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
: 算时间
: 2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
: latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
: 3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
: 能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒到橙汁，最后它们体积仍然是10，问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

l*a2011-12-02 08:12

62 楼

: 1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
: 算时间
: 2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
: latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
: 3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
: 能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒到橙汁，最后它们体积仍然是10，问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

g*e2011-12-02 08:12

63 楼

: 1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
: 算时间
: 2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
: latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
: 3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
: 能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒到橙汁，最后它们体积仍然是10，问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

c*m2011-12-02 08:12

64 楼

你这第六题的回答还真挺非ML方向的。。。

，估
,
32bit

【在 g*****e 的大作中提到】

: 1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
: 算时间
: －－典型的大数据内存放不下排序，merge sort／external sort。可以探讨下cache的
: 优化，减少read fault
: 2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
: latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
: －－对纪录先排序，用stack合并有重叠的，然后hash。因为ip addr其实就是个32bit
: int，所以一般的机器内存也够了。
: 3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
: 能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟

b*s2011-12-02 08:12

65 楼

相由心生，别人一看就不好意思问简单的 :)

【在 g**********y 的大作中提到】

: dongfei你是职业面试家还是怎么回事? :-)
: 我怎么看你各种公司，各种稀奇古怪的问题都被问到了。
:
: ，估
: ,
: 10

m*a2011-12-02 08:12

66 楼

lz有答案吗？

，估
,
橙汁，最后它们体积仍然是10，问橙汁

【在 d********w 的大作中提到】

: 1. 1PB 数据排序，数值范围2^64, 每台机器16G内存，10T数据，普通硬盘，写算法，估
: 算时间
: 2. ip表定位，有个1G个record的ip文件，里面记录（start_ip, end_ip, longitude,
: latitude, country), 给出一个ip，要求迅速查询到地理位置，给的内存有限
: 3. 有几个卫星，可以通信到地面的任意基站，每个基站上都有大量数据，基站之间不
: 能通信，求所有的数据的average, 中位数，要求最少的communication，卫星的容量跟
: 基站一样
: 4. 有杯橙汁和咖啡，体积都是10，把1/10的橙汁倒入到咖啡，在把搅匀的咖啡倒到橙汁，最后它们体积仍然是10，问橙汁
: 中的咖啡跟咖啡中的橙汁数量关系
: 5. 判断有向图中是否有环

j*g2011-12-02 08:12

67 楼

楼主面的啥职位，是和big data有关的吗？