借人气请教一个google面试题# JobHunting - 待字闺中t*e2012-04-08 07:041 楼How to add a counter to www.google.com to track the billionth user.没想出什么好办法,希望大家不吝赐教。
l*82012-04-08 07:043 楼到底要track什么啊? 第10亿个用户? 怎么定义呢?【在 t******e 的大作中提到】: How to add a counter to www.google.com to track the billionth user.: 没想出什么好办法,希望大家不吝赐教。
l*a2012-04-08 07:044 楼确实题意说的太不清楚了但是猜测一下吧。。估计是用IP address/MAC Address等unique信息作为key,算出hash code,然后因为用户众多,assume 一台server放不下通过那个hash code Map reduce到不同的server然后在不同server的hashmap中查看是否新user...然后。。。【在 l*********8 的大作中提到】: 到底要track什么啊? 第10亿个用户? 怎么定义呢?
l*82012-04-08 07:045 楼你的意思是: 找出今天(或者某个时间段)内在google.com查询的第10亿个用户?【在 l*****a 的大作中提到】: 确实题意说的太不清楚了: 但是猜测一下吧。。: 估计是用IP address/MAC Address等unique信息作为key,算出hash code,: 然后因为用户众多,assume 一台server放不下: 通过那个hash code Map reduce到不同的server: 然后在不同server的hashmap中查看是否新user...: 然后。。。
l*a2012-04-08 07:046 楼要track ,起码得先识别出来吧。等LZ的题意说明【在 l*********8 的大作中提到】: 你的意思是: 找出今天(或者某个时间段)内在google.com查询的第10亿个用户?
t*e2012-04-08 07:047 楼应该是从某个时间开始的第10亿个点击google网站用户,我觉得这题的难点是counter的设计,如果用一台server来计数显然设计不scalable,使用分布式计数则计数器同步不好处理。如果用类似windows azure中的message queue来缓存用户请求,然后找到第10亿个用户则存储压力太大。没想出什么好办法,除非题目容许有统计误差。