Redian新闻
>
dell XPS 13 I7/256G SSD $540 (转载)
avatar
dell XPS 13 I7/256G SSD $540 (转载)# Hardware - 计算机硬件
p*7
1
1.开放式问题,有些网站每天只允许有限次访问,怎么抓取网页使得索引尽量全面和新鲜
??
2.在C++文件中只declare class A, 但不以任何方式define class A, 是做什么用
3. Estimate the time cost of transfering 1M of data from one memory stick to
another.
- when the data in memory is sequentially stored; - when the
data in memory is stored in blocks; - does the bus width matter
here?
4.How to transform a unbalanced tree into balanced tree?
第2个题我想的是保留A的名字,以后再定义
第四个题我想的是先算每个节点的blance factor然后再调整,具体怎么调整就不知道了。
第四个题还想到一个办法是转成双链表,然后再转balanced tre
avatar
a*2
2
Ordered online 2:55 am at verizon website, said ship by 9/24. Got tracking
number on 9/21, shipped from memphis on 9/22, got it today!
Gotta cancel another one ordered from apple online store, will ship on oct 8
-10.
avatar
l*n
3
【 以下文字转载自 shopping 讨论区 】
发信人: linden (说LP不对的参见第一条), 信区: shopping
标 题: dell XPS 13 I7/256G SSD $540
发信站: BBS 未名空间站 (Wed Oct 31 13:46:58 2012, 美东)
这个如何?
Processor Processor: Intel Core 2nd Generation i7-2637M Processor (1.70
GHz with Turbo Boost 2.0 up to 2.80 GHz)
Operating System Genuine Windows 7 Home Premium
Base Dell Outlet XPS 13 Ultrabook
Hard Disk Drive 256GB Solid State Drive
Memory 4 GB DDR3 1333MHz
Video Intel HD Graphics 3000
System Color Silver Anodized Aluminium
Laptop Screen 13.3 Inch Hi-Def (720p) True Life WLED Display
Laptop Battery 47 WHr 6-Cell Battery
Network Interface Card Intel Centrino Advanced-N 6230 and Bluetooth 3.0
Web Camera 1.3 megapixel HD Webcam
Keyboard English keyboard
Internal Backlit Keyboard - English
Hardware Upgrade 45 Watt AC Adapter
125V Power Cord
Software Upgrade Genuine Windows 7 Home Premium 64-Bit Operating System
DVD
Genuine Windows 7 Home Premium 64 bit Service Pack 1
Office Software Microsoft Office Starter – reduced functionality Word &
Excel w/ads & no PowerPoint or Outlook
outlet price $540
avatar
p*7
4
顶一下
avatar
k*4
5
什么颜色啊
★ 发自iPhone App: ChineseWeb 7.8
avatar
s*o
6
不在乎屏幕就是好deal
avatar
a*n
7
2. forward declaration
为了避免 a.h include b.h, b.h include a.h的错误
avatar
a*2
8
gold
avatar
m*n
9
2 是为了避免头文件include其他头文件,同时让compiler知道要用到的class。A实际上已经在
lib里被定义过了。
4 先转成array,再变成tree
avatar
M*t
10
祝贺啊,发点包子的。
avatar
p*7
11
转成双链表,然后再转balanced tree,保证了inplace

际上已经在

【在 m*****n 的大作中提到】
: 2 是为了避免头文件include其他头文件,同时让compiler知道要用到的class。A实际上已经在
: lib里被定义过了。
: 4 先转成array,再变成tree

avatar
A*7
12
听起来跟收到绿卡的心情类似:) excited...
avatar
s*t
13
第一个开放式问题 和第3题,如何解答呢?

to
the

【在 p********7 的大作中提到】
: 1.开放式问题,有些网站每天只允许有限次访问,怎么抓取网页使得索引尽量全面和新鲜
: ??
: 2.在C++文件中只declare class A, 但不以任何方式define class A, 是做什么用
: 3. Estimate the time cost of transfering 1M of data from one memory stick to
: another.
: - when the data in memory is sequentially stored; - when the
: data in memory is stored in blocks; - does the bus width matter
: here?
: 4.How to transform a unbalanced tree into balanced tree?
: 第2个题我想的是保留A的名字,以后再定义

avatar
k*y
14
how were you able to order another one? I ordered from AT
avatar
p*7
15
顶一下,求高手回到1,3题
avatar
k*y
16
how were you able to order another one? I ordered from AT
avatar
A*r
17
唉,我挺怕这种题的,希望只是电面题,on-site的时候不要被问到。。
对于第三题,不明白究竟是要考察什么,如果给出读写的rate, 然后加起来不就是么
estimate time?
如果是比较sequentially stored和stored in blocks的话,前者读起来会快一点的。
。另外对于memory stick, 号称是可以直接读写不用进入memory的,所以我猜跟bus
width没关系。。
在现实生活中,传送1M的数据时间大概不需要一秒钟吧。。

to
the

【在 p********7 的大作中提到】
: 1.开放式问题,有些网站每天只允许有限次访问,怎么抓取网页使得索引尽量全面和新鲜
: ??
: 2.在C++文件中只declare class A, 但不以任何方式define class A, 是做什么用
: 3. Estimate the time cost of transfering 1M of data from one memory stick to
: another.
: - when the data in memory is sequentially stored; - when the
: data in memory is stored in blocks; - does the bus width matter
: here?
: 4.How to transform a unbalanced tree into balanced tree?
: 第2个题我想的是保留A的名字,以后再定义

avatar
k*y
18
how were you able to order another one? I ordered from AT
avatar
p*7
19
对于第一题我有个猜想,一般就是用queue去存,用tree或者hash去判重,如果因为访
问次数限制,那么就自动保留queue和tree或者hash的信息,并且记录这个网站,以及
这个网站的限制次数,把这类网站都加入到一个新的任务中,这类任务每天都访问
limited number次数。而且还要给每一个网站分配空间去保存他们各自的queue和tree。
tree 大概是这样
mitbbs
article_t mitbbs_bbssec bbsboa
JobHunting *** **** *** ***
31690961
avatar
a*2
20
I ordered from Apple online store

【在 k***y 的大作中提到】
: how were you able to order another one? I ordered from AT
avatar
y*e
21
对于第一题,有很多情况没有clear。
“只允许有限次访问”,是限制单纯的访问次数,还是访问下载的流量?
是限制IP吗?还是根据hostname限制?
若是根据IP限制,那么Google的crawler有好几个,IP都不一样。可以每个crawler
分别去爬去文档。
1、设定一个window时间,在该window时间范围内不再访问该网站。
比如,初始 window = 5 min,那么 crawler 在5分钟之类不会再次访问该网站。可以
用数据结构 hashtable,保存 { URLSignature -> Timestamp } 的映射。
每次遇到一个URL,查询上一次访问的 Timestamp,并判断 CurrentTime >
Timestamp + Window。
若是通过,就检查网页是否更新。
若是不通过,或者检查网页发现没有更新,window *= 2。
这有点类似于 TCP 的 slow start,用来限制过快的访问同一个网页。若是发现网页有更
新,把 window 设置回初始值。window 最大只能增长到一个特定值,比如,1天。
2、每次访问先下载 HTTP
avatar
a*7
22
LZ上图看看啊
avatar
y*e
23
第三题其实是考察面试者对存储设备的实现是否了解。
这里的 memory stick 应该是优盘,速度比较慢的那种。
一般的存储设备,若是数据是 sequential stored,那么读取速度就会很快。不然,就
需要 random seek,速度就很慢了。
可以想象一个存储设备的实现是 Linked List,若是 sequential stored,那么最多读
取 O(n) 次,这里 n 就是文件的大小。若是有很多碎片,那么最坏的情况就是 O(N),
这里 N 是整个设备的大小!
当然,存储设备也提供随机读取,虽然比顺序读取慢很多(相差1~2个数量级),但
是也比顺序扫描完整个设备要快很多。
用 n 来表示文件的大小,s 来表示顺序读取速度,用 k 来表示随机读取速度。一般
的,s 的值介于 10k~100k 之间。
若是文件没有碎片,那么读取的消耗是 C1 = 1 / k + n / s
若是文件有 x 个碎片,那么读取的消耗就是 C2 = (1 + x) * (1 / k) + (n / x) / s。
设 s = 10k,x = n / 2。那么,
C1 = 1 / k + n
avatar
A*r
24


【在 y*********e 的大作中提到】
: 对于第一题,有很多情况没有clear。
: “只允许有限次访问”,是限制单纯的访问次数,还是访问下载的流量?
: 是限制IP吗?还是根据hostname限制?
: 若是根据IP限制,那么Google的crawler有好几个,IP都不一样。可以每个crawler
: 分别去爬去文档。
: 1、设定一个window时间,在该window时间范围内不再访问该网站。
: 比如,初始 window = 5 min,那么 crawler 在5分钟之类不会再次访问该网站。可以
: 用数据结构 hashtable,保存 { URLSignature -> Timestamp } 的映射。
: 每次遇到一个URL,查询上一次访问的 Timestamp,并判断 CurrentTime >
: Timestamp + Window。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。