Redian新闻
>
2岁的孩子你们都会说什么?
avatar
2岁的孩子你们都会说什么?# Parenting - 为人父母
t*e
1
Assume the data cannot fit in memory. You can provide either exact or
approximate solutions. Please provide more details about your solution.
avatar
i*t
2
请问一下
avatar
i*h
3
近似:
内存有多少用多少, 每个记录出现次数
当新的记录进来, 内存不够了, 踢掉最少最老的记录
精确:
用外部文件存结果?
avatar
p*i
4
None.

【在 i******t 的大作中提到】
: 请问一下
avatar
b*d
5
哥也被问到这道题了,略有不同,给出了incoming query的distribution的曲线,qps
是几千这样子。这个system有三个api:
1)getTopTenMillionInPastHour()
2) isInTopTenMilionInPastHour()
3) notifyWhenJoinOrRemovedFromTopTenMillionInPastHour()
自己来architect系统,定义service能提供数据的精度。
我当时给的是个多台机器的架构。我觉得是旧data每秒钟都在产生(任何当前时间进行
的api call,准确来说,1小时零1秒前的数据都是旧的,对算top10millioninPastHour
没有意义),但几乎没有任何系统在一秒钟内可以purge掉这么多的旧数据,所以就要
定义一个精度。比如,semantics是“我能保证给结果是精确的,但是有个最多20分钟
的delay”,或者“我不能保证结果是100%精确的,但是我能最新的query能够实时的反
应在结果中,并且返回的结果和真值有90%的重合”。
其实就是说consistency,availability,partition/sharding, 只能选两样。
avatar
az
6
孩子跟孩子差别很大,医生说没问题就好。。。
老大那会能说的单词很有限,句子也只限于很简单的2,3个字的
老二日常用品基本差不多,基本的话都会说了,我这两天摘抄的:
晚上睡在床上,弟弟说,一个滑梯是干的,一个滑梯是湿的,不敢坐湿的,有水水,坐
了要换裤子
早起弟弟说,妈妈,你好吧,妈妈抱小宝贝下楼喝奶奶
奶奶上楼拿被子,弟弟站在楼梯口,奶奶问你干嘛呢。弟弟说,我站在这里等奶奶拿蓝
色花被被
弟弟把买菜车推到了,说,我把这个推到了,爸爸妈妈哥哥奶奶爷爷都不爱我了,呜呜
呜呜
奶奶上厕所的功夫,他摔倒了,自己说,我害怕,摔了个大跟头

【在 i******t 的大作中提到】
: 请问一下
avatar
w*x
7

比如找top 10 queries, 把大文件hash分成200个小文件, 每个小文件可以放入内存.
每个小文件取top 5 queries, 从1000个query中找出前10个, 除非很巧, 基本可以得出
top 10

【在 t*****e 的大作中提到】
: Assume the data cannot fit in memory. You can provide either exact or
: approximate solutions. Please provide more details about your solution.

avatar
r*f
8
楼上看懂了?强
avatar
N*n
9
大神你还没回答我你从哪儿找到的800道题呢

【在 w****x 的大作中提到】
:
: 比如找top 10 queries, 把大文件hash分成200个小文件, 每个小文件可以放入内存.
: 每个小文件取top 5 queries, 从1000个query中找出前10个, 除非很巧, 基本可以得出
: top 10

avatar
C*e
10
老二后进娃一个。2岁过才会叫妈。就这一个词。别的都不会。叫爸爸也不会。曾经一
度怀疑有问题。老大一岁过后就会叫妈咪。2岁已经开始句子了。
avatar
t*e
11
踢掉最少最老的记录
But those queries might showed again in the future? they might be in the
list of top 10 queries.

【在 i***h 的大作中提到】
: 近似:
: 内存有多少用多少, 每个记录出现次数
: 当新的记录进来, 内存不够了, 踢掉最少最老的记录
: 精确:
: 用外部文件存结果?

avatar
k*m
12
我家大宝7个多月就会喊爸爸妈妈,一岁多就很会说了,一套一套的,像个小大人似的。
逛超市,看到玩具想买,我跟她说这是大宝宝玩的,以后才能买,她回答:等宝宝长大
了,宝宝都要买,这个(指着娃娃),这个(指着车子),全都买回去,都是宝宝的…
… 晕~
晚上睡觉前:妈妈讲故事给宝宝听。我说:宝宝想听什么故事啊?她说:妈妈讲喜羊羊
的故事,喜羊羊去公园的故事。于是我开始编故事……
avatar
t*e
13
Can you explain more detail about your system? Particularly, how you can get
the 90% accuracy?

qps
top10millioninPastHour

【在 b*******d 的大作中提到】
: 哥也被问到这道题了,略有不同,给出了incoming query的distribution的曲线,qps
: 是几千这样子。这个system有三个api:
: 1)getTopTenMillionInPastHour()
: 2) isInTopTenMilionInPastHour()
: 3) notifyWhenJoinOrRemovedFromTopTenMillionInPastHour()
: 自己来architect系统,定义service能提供数据的精度。
: 我当时给的是个多台机器的架构。我觉得是旧data每秒钟都在产生(任何当前时间进行
: 的api call,准确来说,1小时零1秒前的数据都是旧的,对算top10millioninPastHour
: 没有意义),但几乎没有任何系统在一秒钟内可以purge掉这么多的旧数据,所以就要
: 定义一个精度。比如,semantics是“我能保证给结果是精确的,但是有个最多20分钟

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。