Redian新闻
>
用求模分组的方法统计IP访问频率最高的那题,不明白,求解惑
avatar
用求模分组的方法统计IP访问频率最高的那题,不明白,求解惑# JobHunting - 待字闺中
r*n
1
访问的IP的log 文件很大,比如10G,内存1G,所以不能放入内存;
于是用求模的方法比如模1024, 最多会有1024个小文件。
我的问题是是每个文件的大小的上限依然是不确定的,
比如一种情况是所有IP都是一样的,肯定所有的IP会被分到一个文件里,它的大小还是
10G,
这个方法起不到分而治之的作用,是不是我理解错了, 求解惑!
avatar
w*m
2
为什么文件需要要放内存?是因为ip空间大才放不了内存的

【在 r*******n 的大作中提到】
: 访问的IP的log 文件很大,比如10G,内存1G,所以不能放入内存;
: 于是用求模的方法比如模1024, 最多会有1024个小文件。
: 我的问题是是每个文件的大小的上限依然是不确定的,
: 比如一种情况是所有IP都是一样的,肯定所有的IP会被分到一个文件里,它的大小还是
: 10G,
: 这个方法起不到分而治之的作用,是不是我理解错了, 求解惑!

avatar
r*n
3
明白了

【在 w*********m 的大作中提到】
: 为什么文件需要要放内存?是因为ip空间大才放不了内存的
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。