那个streaming data 求出现次数topk的题目到底怎么做的？ - 未名空间MITBBS历史存档

国际科技财经博客移民网络热点娱乐民生时事公众号

Redian新闻

>未名空间

>JobHunting - 待字闺中

那个streaming data 求出现次数topk的题目到底怎么做的？

那个streaming data 求出现次数topk的题目到底怎么做的？# JobHunting - 待字闺中

n*s2013-11-03 07:11

1 楼

总是要hash
为了有效地求出topk, 则需要对value作手脚，比较直接的想法是维护一个minimum堆+
零散node, 每个node可以通过对data O(1)lookup到，并且node包括, 每
次有stream来了data, 就对node的count作update,需要topk时候根据发生过的变化调
整heap。
不知道有没有比较漂亮的做法。