那个streaming data 求出现次数topk的题目 到底怎么做的?# JobHunting - 待字闺中
n*s
1 楼
总是要hash
为了有效地求出topk, 则需要对value作手脚,比较直接的想法是维护一个minimum堆+
零散node, 每个node可以通过对data O(1)lookup到,并且node包括, 每
次有stream来了data, 就对node的count作update,需要topk时候 根据发生过的变化调
整heap。
不知道有没有比较漂亮的做法。
为了有效地求出topk, 则需要对value作手脚,比较直接的想法是维护一个minimum堆+
零散node, 每个node可以通过对data O(1)lookup到,并且node包括, 每
次有stream来了data, 就对node的count作update,需要topk时候 根据发生过的变化调
整heap。
不知道有没有比较漂亮的做法。