这道amazon的题怎么弄?# JobHunting - 待字闺中b*y2011-05-09 07:051 楼large log file,含有 customer id, product id, time stamp想得到在某一天中某个custom看网页的次数1. 足够memory2. limited memory
b*y2011-05-09 07:053 楼排序?有三个column分别是time, custom和product【在 l*****a 的大作中提到】: 内存有限就external sort。: time stamp , customer id, product id 排序。
y*m2011-05-09 07:054 楼最土的办法不是分片读取累加么...【在 b*******y 的大作中提到】: large log file,含有 customer id, product id, time stamp: 想得到在某一天中某个custom看网页的次数: 1. 足够memory: 2. limited memory
b*y2011-05-09 07:056 楼up一下【在 b*******y 的大作中提到】: large log file,含有 customer id, product id, time stamp: 想得到在某一天中某个custom看网页的次数: 1. 足够memory: 2. limited memory
f*w2011-05-09 07:057 楼为什么要sort ? log文件不一般都是按照时间排序的么? 所以步骤是 1)找到想要的时间区间 2) 然后go through一遍 Step 2完全不是问题,不管内存是不是够,可以直接在文件上操作;对于Step1, 如果内存不够的话就分块载入,然后再在内存中找合适的位置
b*y2011-05-09 07:058 楼那epic time这个条件应该怎么考虑【在 f*****w 的大作中提到】: 为什么要sort ? log文件不一般都是按照时间排序的么? 所以步骤是 1)找到想要的: 时间区间 2) 然后go through一遍 : Step 2完全不是问题,不管内存是不是够,可以直接在文件上操作;: 对于Step1, 如果内存不够的话就分块载入,然后再在内存中找合适的位置