Redian新闻
>
Data被drained 求分析
avatar
Data被drained 求分析# PDA - 掌中宝
c*r
1
一百万个amazon product id,问过去一小时销售量top 10的(map- reduce)
这题我的想法是用一个size10的MinHeap。 但是这100万个Product id分布在不同的
machine上,可能需要用map reduce去count每个product id的frequency,之后再
insert到heap里。但是这个Map-reduce具体是怎么实现的大牛能不能来讲下?
avatar
t*3
2
Android OS都干吗了用这么多data
另外Google Pinyin也这么狠
avatar
p*p
3
co ask
根据我的皮毛知识就是
Map的pair是
Reduce就是负责累加freq和排序
avatar
h*b
4
google 同步,android system update
avatar
p*2
5
这个用map reduce好像是很普通的应用吧?
avatar
t*3
6
坑爹死了

【在 h**b 的大作中提到】
: google 同步,android system update
avatar
h*t
7
en, map reduce 101 example, almost same as word count example.
BTW, 你现在也懂mapreduce了?

【在 p*****2 的大作中提到】
: 这个用map reduce好像是很普通的应用吧?
avatar
p*2
8

前几天为了总结system design扫了一眼G的mapreduce paper。

【在 h***t 的大作中提到】
: en, map reduce 101 example, almost same as word count example.
: BTW, 你现在也懂mapreduce了?

avatar
j*9
9
Map: Key: product id, value : frequency
After Reduce :
Key: product id, value : total frequency
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。