Redian新闻
>
帮忙推荐下mortage company (new jersey)
avatar
帮忙推荐下mortage company (new jersey)# Living
c*s
1
是去年十一月参加的店面。
面试开始前有个company overview presentation。 最好知道他们是那一年创立的,创
始人是谁。 可能会问到。
四轮:
1. 印度人。
- 在设计算法时,你会考虑什么因素?
- 给一个chess board,16 cells x 16 cells. 用 2 x 2 的 windows 去覆盖 (no
overlap), 需要几个windows。对于这些windows所形成的一个新的layer,再用更大
的2x2的window去覆盖 (no overlap)。如此类推,直到新的layer只有一个window。
问一共要用多少个windows。 假如windows可以overlap,但不完全cover each other,
一共又要用多少个windows?
- 写pseudocode去detect cycle in a directed graph.
2. 东亚裔。有可能是越南人
- 写pseudocode 去解决2-sum, 3-sum, and in general n-sum 问题。
3. ABC
- OOP design。 设计classes 去表示人的身体 (头,躯干,肩膀,手臂,手,腿,
脚,。。。)大概讲一下思路。设计classes 去simulate一个数字手表 (display 时
,分, 秒)。秒的变化造成分钟的变化,分钟的变化造成小时的变化。我全用Java写
的。
4. 印度人。
- write singly linked list insert function
- 有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限
制大小是1M。返回频数最高的100个词。(第三题 in 十道海量数据处理面试题与十个
方法大总结)
作为fresh PhD,几乎每一轮都问了我的研究项目。尤其在第三和第四轮。在白板上画
图,讲了不少。
周三面试,下周六收到邮件promise offer. Software Engineer 职位。祝大家面试成
功!
avatar
T*y
2
大家帮忙推荐下在new jersey有业务的好的mortage company?
准备买房子了。多谢
avatar
j*y
3
cong !!!
dectect a cycle 是用 dfs 吧?

【在 c********s 的大作中提到】
: 是去年十一月参加的店面。
: 面试开始前有个company overview presentation。 最好知道他们是那一年创立的,创
: 始人是谁。 可能会问到。
: 四轮:
: 1. 印度人。
: - 在设计算法时,你会考虑什么因素?
: - 给一个chess board,16 cells x 16 cells. 用 2 x 2 的 windows 去覆盖 (no
: overlap), 需要几个windows。对于这些windows所形成的一个新的layer,再用更大
: 的2x2的window去覆盖 (no overlap)。如此类推,直到新的layer只有一个window。
: 问一共要用多少个windows。 假如windows可以overlap,但不完全cover each other,

avatar
c*s
4
Yes. Color DFS.

【在 j*****y 的大作中提到】
: cong !!!
: dectect a cycle 是用 dfs 吧?

avatar
c*t
5
恭喜恭喜!!
85 without overlap
假如windows可以overlap,但不完全cover each other,
一共又要用多少个windows?不懂什么意思,85个以上?
directed graph cycle,可不可以用DAG做?无解既是有cycle.
n-sum是用DP吗?还是recursion+backtracking? 复杂度是多少?
看了一下大文件那道题,我怎么觉得不对呢,有的词在,分的5000个文件非常平均分布
,在所有里面都没到前100的频率,但5000文件合起来后,就有可能进前100啊。还有就
是第一个文件里前100的词,在其他文件里可能是100以后,那他的出现频率就不会被其
他文件统计,没有到生成的小文件里,影响merge结果正确性。
同理十道海量数据处理面试题第一题也有这个问题啊。
是我哪里想的不对吗?

【在 c********s 的大作中提到】
: 是去年十一月参加的店面。
: 面试开始前有个company overview presentation。 最好知道他们是那一年创立的,创
: 始人是谁。 可能会问到。
: 四轮:
: 1. 印度人。
: - 在设计算法时,你会考虑什么因素?
: - 给一个chess board,16 cells x 16 cells. 用 2 x 2 的 windows 去覆盖 (no
: overlap), 需要几个windows。对于这些windows所形成的一个新的layer,再用更大
: 的2x2的window去覆盖 (no overlap)。如此类推,直到新的layer只有一个window。
: 问一共要用多少个windows。 假如windows可以overlap,但不完全cover each other,

avatar
f*7
6
Cong!
avatar
s*y
7
Cong!
Lz是fresh职位?
avatar
f*e
8
求内推!

【在 c********s 的大作中提到】
: 是去年十一月参加的店面。
: 面试开始前有个company overview presentation。 最好知道他们是那一年创立的,创
: 始人是谁。 可能会问到。
: 四轮:
: 1. 印度人。
: - 在设计算法时,你会考虑什么因素?
: - 给一个chess board,16 cells x 16 cells. 用 2 x 2 的 windows 去覆盖 (no
: overlap), 需要几个windows。对于这些windows所形成的一个新的layer,再用更大
: 的2x2的window去覆盖 (no overlap)。如此类推,直到新的layer只有一个window。
: 问一共要用多少个windows。 假如windows可以overlap,但不完全cover each other,

avatar
s*y
9
同求啊,投了没人回
avatar
c*s
10
长,宽方向各overlap一个cell. 第一个layer,15x15windows。 第二个
layer14x14windows。keep going like this.
只要算法work就行。
记得当时写的的是recursion+backtracking。
avatar
c*s
11
我是去年秋天系里的on campus career fair 中投简历。没有用内推。

【在 f*****e 的大作中提到】
: 求内推!
avatar
c*s
12
Yes.

【在 s***y 的大作中提到】
: Cong!
: Lz是fresh职位?

avatar
c*a
13
n-sum好像就是leetcode的Combination Sum II啊
avatar
e*e
14
fatalme问你能不能内推他/她。

【在 c********s 的大作中提到】
: 我是去年秋天系里的on campus career fair 中投简历。没有用内推。
avatar
c*s
15
还没开始工作,怎么内推呢?

【在 f*****e 的大作中提到】
: 求内推!
avatar
e*e
16
问题4.2在“十道海量数据处理”里的解答似乎有问题。
《《《《
方案:顺序读文件中,对于每个词x,取hash(x)%5000,然后按照该值存到5000个
小文件(记为x0,x1,...x4999)中。这样每个文件大概是200k左右。
如果其中的有的文件超过了1M大小,还可以按照类似的方法继续往下分,直到分解
得到的小文件的大小都不超过1M。
对每个小文件,统计每个文件中出现的词以及相应的频率(可以采用trie树/hash_
map等),并取出出现频率最大的100个词(可以用含100个结点的最小堆),并把100个
词及相应的频率存入文件,这样又得到了5000个文件。下一步就是把这5000个文件进行
归并(类似与归并排序)的过程了。
>>>>>>>>
对每个小文件取出出现频率最大的100个词, 也许某个文件里包含出现频率第101大的词
,如果这个词和其他文件的同一个词合并后,频率很高,应出现在最终结果里.但是因为用
了上面的方法,而没有在最终结果里. i.e.
2个文件,找出频率最大的两个词.
file A: file B:
a 10 d 10
b 9 e 9
c 8 c 8
f 7 f 7
上述做法:
top 2 in file A; top 2 file file B:
a 10 d 10
b 9 e 9
归并排序之后, a 10, d 10, b 9, e 9
最终结果: a, d
正确结果: c, f
avatar
l*a
17
he used hashcode
the same thing will appear in the same bucket
that is the key point
even u divide them into smaller file, this also applies

hash_

【在 e****e 的大作中提到】
: 问题4.2在“十道海量数据处理”里的解答似乎有问题。
: 《《《《
: 方案:顺序读文件中,对于每个词x,取hash(x)%5000,然后按照该值存到5000个
: 小文件(记为x0,x1,...x4999)中。这样每个文件大概是200k左右。
: 如果其中的有的文件超过了1M大小,还可以按照类似的方法继续往下分,直到分解
: 得到的小文件的大小都不超过1M。
: 对每个小文件,统计每个文件中出现的词以及相应的频率(可以采用trie树/hash_
: map等),并取出出现频率最大的100个词(可以用含100个结点的最小堆),并把100个
: 词及相应的频率存入文件,这样又得到了5000个文件。下一步就是把这5000个文件进行
: 归并(类似与归并排序)的过程了。

avatar
c*t
18
和我说的一个意思,确实有问题。
我觉得可以分解成5000小文件,分别按频率从高到低sort, 然后external merge

hash_

【在 e****e 的大作中提到】
: 问题4.2在“十道海量数据处理”里的解答似乎有问题。
: 《《《《
: 方案:顺序读文件中,对于每个词x,取hash(x)%5000,然后按照该值存到5000个
: 小文件(记为x0,x1,...x4999)中。这样每个文件大概是200k左右。
: 如果其中的有的文件超过了1M大小,还可以按照类似的方法继续往下分,直到分解
: 得到的小文件的大小都不超过1M。
: 对每个小文件,统计每个文件中出现的词以及相应的频率(可以采用trie树/hash_
: map等),并取出出现频率最大的100个词(可以用含100个结点的最小堆),并把100个
: 词及相应的频率存入文件,这样又得到了5000个文件。下一步就是把这5000个文件进行
: 归并(类似与归并排序)的过程了。

avatar
c*t
19
多谢解答!

【在 c********s 的大作中提到】
: 长,宽方向各overlap一个cell. 第一个layer,15x15windows。 第二个
: layer14x14windows。keep going like this.
: 只要算法work就行。
: 记得当时写的的是recursion+backtracking。

avatar
P*b
20
你的c,
f怎么同时出现在两个文件里呢?

hash_

【在 e****e 的大作中提到】
: 问题4.2在“十道海量数据处理”里的解答似乎有问题。
: 《《《《
: 方案:顺序读文件中,对于每个词x,取hash(x)%5000,然后按照该值存到5000个
: 小文件(记为x0,x1,...x4999)中。这样每个文件大概是200k左右。
: 如果其中的有的文件超过了1M大小,还可以按照类似的方法继续往下分,直到分解
: 得到的小文件的大小都不超过1M。
: 对每个小文件,统计每个文件中出现的词以及相应的频率(可以采用trie树/hash_
: map等),并取出出现频率最大的100个词(可以用含100个结点的最小堆),并把100个
: 词及相应的频率存入文件,这样又得到了5000个文件。下一步就是把这5000个文件进行
: 归并(类似与归并排序)的过程了。

avatar
c*t
21
哦,才读明白,多谢多谢!

【在 l*****a 的大作中提到】
: he used hashcode
: the same thing will appear in the same bucket
: that is the key point
: even u divide them into smaller file, this also applies
:
: hash_

avatar
e*e
22
明白了, 多谢解惑.

【在 l*****a 的大作中提到】
: he used hashcode
: the same thing will appear in the same bucket
: that is the key point
: even u divide them into smaller file, this also applies
:
: hash_

avatar
k*x
23
烙印+小越,good luck!

【在 c********s 的大作中提到】
: 是去年十一月参加的店面。
: 面试开始前有个company overview presentation。 最好知道他们是那一年创立的,创
: 始人是谁。 可能会问到。
: 四轮:
: 1. 印度人。
: - 在设计算法时,你会考虑什么因素?
: - 给一个chess board,16 cells x 16 cells. 用 2 x 2 的 windows 去覆盖 (no
: overlap), 需要几个windows。对于这些windows所形成的一个新的layer,再用更大
: 的2x2的window去覆盖 (no overlap)。如此类推,直到新的layer只有一个window。
: 问一共要用多少个windows。 假如windows可以overlap,但不完全cover each other,

avatar
k*x
24
烙印+小越,good luck!

【在 c********s 的大作中提到】
: 是去年十一月参加的店面。
: 面试开始前有个company overview presentation。 最好知道他们是那一年创立的,创
: 始人是谁。 可能会问到。
: 四轮:
: 1. 印度人。
: - 在设计算法时,你会考虑什么因素?
: - 给一个chess board,16 cells x 16 cells. 用 2 x 2 的 windows 去覆盖 (no
: overlap), 需要几个windows。对于这些windows所形成的一个新的layer,再用更大
: 的2x2的window去覆盖 (no overlap)。如此类推,直到新的layer只有一个window。
: 问一共要用多少个windows。 假如windows可以overlap,但不完全cover each other,

avatar
P*b
25
越南人咋了?

【在 k*x 的大作中提到】
: 烙印+小越,good luck!
avatar
b*g
26
字符串不用hash
Step1:
radix sort, don't need to divide into small files. radix sort knows
where to write in a file.
Step2:
min priority queue store the 100 highest frequency word.

hash_

【在 e****e 的大作中提到】
: 问题4.2在“十道海量数据处理”里的解答似乎有问题。
: 《《《《
: 方案:顺序读文件中,对于每个词x,取hash(x)%5000,然后按照该值存到5000个
: 小文件(记为x0,x1,...x4999)中。这样每个文件大概是200k左右。
: 如果其中的有的文件超过了1M大小,还可以按照类似的方法继续往下分,直到分解
: 得到的小文件的大小都不超过1M。
: 对每个小文件,统计每个文件中出现的词以及相应的频率(可以采用trie树/hash_
: map等),并取出出现频率最大的100个词(可以用含100个结点的最小堆),并把100个
: 词及相应的频率存入文件,这样又得到了5000个文件。下一步就是把这5000个文件进行
: 归并(类似与归并排序)的过程了。

avatar
c*e
27
请问
在设计算法时,你会考虑什么因素?
怎么回答?
Cong! thanks!
avatar
p*p
28
考虑什么因素怎么回答?
correctness, space complexity, time complexity?
n-sum怎么弄的?recursive?

【在 c********s 的大作中提到】
: 是去年十一月参加的店面。
: 面试开始前有个company overview presentation。 最好知道他们是那一年创立的,创
: 始人是谁。 可能会问到。
: 四轮:
: 1. 印度人。
: - 在设计算法时,你会考虑什么因素?
: - 给一个chess board,16 cells x 16 cells. 用 2 x 2 的 windows 去覆盖 (no
: overlap), 需要几个windows。对于这些windows所形成的一个新的layer,再用更大
: 的2x2的window去覆盖 (no overlap)。如此类推,直到新的layer只有一个window。
: 问一共要用多少个windows。 假如windows可以overlap,但不完全cover each other,

avatar
k*x
29
越南人,特别是逃难过来的那批,极端仇恨中国

【在 P*******b 的大作中提到】
: 越南人咋了?
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。