Redian新闻
>
一般给教授多少写推荐信的时间?
avatar
一般给教授多少写推荐信的时间?# Biology - 生物学
x*y
1
一个含1 million 32位整数的文件,统计不同整数出现次数的直方图,以及算法复杂度.
要求:文件内容只能顺序读取,可以自己建临时文件进行读写,同时可打开的文件数无
限制,但是内存中只能保留3000个整数。
想不出来该怎么做,哪位能指点一下,谢谢!
avatar
h*i
2
avatar
O*h
3
mint condition, barely used
箱子配件应该都在
准备加PCI SATA卡,需要换成能有8bay的机箱,Q08就太小了
大概值多少?
avatar
t*0
4
phd毕业继续在本实验室做薄厚 走形式需要几封推荐信 一个是系里管研究生的老师 一
个是committee member 给他们两周写推荐信的时间紧么?谢谢!
avatar
A*H
5
map/reduce, read numbers and write to different temp files based on the
range (partition 32 bit numbers), and count on each temp file, each map jobs
can run in parallels
avatar
q*d
6
老将们都是柴大妈类型的,
需要用谎言去反对你们的敌人

【在 h***i 的大作中提到】

avatar
t*0
7
自己顶
avatar
j*u
8
这种题真无聊
1 million int=4MB is nothing,非要split成1M/3000个temp file。。。

度.

【在 x**y 的大作中提到】
: 一个含1 million 32位整数的文件,统计不同整数出现次数的直方图,以及算法复杂度.
: 要求:文件内容只能顺序读取,可以自己建临时文件进行读写,同时可打开的文件数无
: 限制,但是内存中只能保留3000个整数。
: 想不出来该怎么做,哪位能指点一下,谢谢!

avatar
h*i
9
以前的共产党还讲真话,现在的都是假话

【在 q*d 的大作中提到】
: 老将们都是柴大妈类型的,
: 需要用谎言去反对你们的敌人

avatar
k*l
10
应该OK吧,感觉也就十几分钟的事

【在 t*******0 的大作中提到】
: phd毕业继续在本实验室做薄厚 走形式需要几封推荐信 一个是系里管研究生的老师 一
: 个是committee member 给他们两周写推荐信的时间紧么?谢谢!

avatar
a*c
11
its not that bad. If you tweaked the problem a little bit and make a
dynamic version out of it, you could write a paper about it
http://www.google.com/url?
sa=t&source=web&cd=2&ved=0CBoQFjAB&url=http%3A%2F%2Fciteseerx.ist.psu.e
du%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.151.5909%26rep%3Drep1%26type%3Dp
df&ei=b7jdTKboPImisAOjpJ2jCg&usg=AFQjCNEYdtuky0sBzQ7kHeKblwqXOkmELA&sig
2=7zl4nStfKHQdoLKxWEKqZg

【在 j*****u 的大作中提到】
: 这种题真无聊
: 1 million int=4MB is nothing,非要split成1M/3000个temp file。。。
:
: 度.

avatar
q*d
12
刘文彩是谁创造出来的?

【在 h***i 的大作中提到】
: 以前的共产党还讲真话,现在的都是假话
avatar
w*r
13
有的第二天就写好,
有的要一两个月
avatar
x*y
14
多谢各位,还有个问题就是如果这样做的话,每个integer读入内存的次数的上限应该
怎么确定啊
avatar
h*i
15
现在有更多的刘文彩
盘剥人民
现在共产党说刘文彩是好人

【在 q*d 的大作中提到】
: 刘文彩是谁创造出来的?
avatar
k*0
16
婉转告诉他们老板什么时候要,在这之前寄出就好了。
avatar
x*y
17
如果不用mapreduce的话,该怎么设计呢,思考中。。。。。。。。
avatar
q*d
18
你再悲愤,也没法改变刘文彩过去的大量宣传都是造假的事实

【在 h***i 的大作中提到】
: 现在有更多的刘文彩
: 盘剥人民
: 现在共产党说刘文彩是好人

avatar
j*u
19
我上面说了啊,split成1M/3000=334个file
scan file的同时写这334个temp file,按照range决定比如第一个file是0-2999
然后读每个temp file,sort后写输出,就分别都是sort好的
第二步没有map reduce,单机的话即使你同时做,因为瓶颈是IO(sort 3000 items is
nothing)也不会快

【在 x**y 的大作中提到】
: 如果不用mapreduce的话,该怎么设计呢,思考中。。。。。。。。
avatar
h*i
20
扯淡
现在大量的宣传都是企图掩盖盘剥人民的事实的虚假宣传
你个中宣部的5毛

【在 q*d 的大作中提到】
: 你再悲愤,也没法改变刘文彩过去的大量宣传都是造假的事实
avatar
x*y
21
有个问题,你所说的range是指integer的value吧,如果说在某个range里,比如0-2999
,有10000个数,只有3000的内存,怎么sort?

【在 j*****u 的大作中提到】
: 我上面说了啊,split成1M/3000=334个file
: scan file的同时写这334个temp file,按照range决定比如第一个file是0-2999
: 然后读每个temp file,sort后写输出,就分别都是sort好的
: 第二步没有map reduce,单机的话即使你同时做,因为瓶颈是IO(sort 3000 items is
: nothing)也不会快

avatar
H*7
22
收租院又成老将编出来的了?

【在 q*d 的大作中提到】
: 老将们都是柴大妈类型的,
: 需要用谎言去反对你们的敌人

avatar
m*k
23
keep reading Ints in from the 1M Ints,
constructing a Sorted map, key is the Int, value is its freq,
once the mem is full, say 1500 entries,
output to a temp file,
repeat this step,
.....
now u get at the most ceil(1M/1500) = 667 tmp files, all sorted internally
by key with key-value pairs,
now take the first entry from each tmp file,
MERGE: merge in mem, say <1, 5> and <1, 2> merge to <1, 7>,
remember the min key is from which tmp fileS, it may come from more than 1
tmp file,say tmp x and tmp y,
output the min key with its freq and remove the entry from mem,
read in next entries from tmp x and tmp y(if there r still entries)
if map is empty, done,
else goto MERGE
avatar
s*r
24
two-pass external sort, again?

2999

【在 x**y 的大作中提到】
: 有个问题,你所说的range是指integer的value吧,如果说在某个range里,比如0-2999
: ,有10000个数,只有3000的内存,怎么sort?

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。