发现重生系作者大部分都是种马# paladin - 谈古论金,黄梁一梦
m*9
1 楼
问题1: 2个超大file,memory容不下,都是unsorted,假设里面全是integer。如何找
出2个文件
中的重复部分?
我看到的一个答案是:
step 1: external merge sort F1 (file 1): 将原文件分成若干个temporary
smaller
files, 对每个temporary small file进行quicksort,然后对所有smaller files 进行
multiple-way merge sort, 重新合并成一个sorted big file.
step 2: traverse F2, binary search F2's each element in F1,
step 3: 能找则是common element,如果找不到则继续读取判断下一个element
问题2: 1个超级大文件,unsorted,里面都是string。如何找出所有的anagram?
这个题没什么思路
求教了,谢谢
出2个文件
中的重复部分?
我看到的一个答案是:
step 1: external merge sort F1 (file 1): 将原文件分成若干个temporary
smaller
files, 对每个temporary small file进行quicksort,然后对所有smaller files 进行
multiple-way merge sort, 重新合并成一个sorted big file.
step 2: traverse F2, binary search F2's each element in F1,
step 3: 能找则是common element,如果找不到则继续读取判断下一个element
问题2: 1个超级大文件,unsorted,里面都是string。如何找出所有的anagram?
这个题没什么思路
求教了,谢谢