Redian新闻
>
TSC EB1-B PP 过 (12-31-2012)
avatar
TSC EB1-B PP 过 (12-31-2012)# Immigration - 落地生根
d*k
1
昨天面的,估计我没有达到考官的预期值,应该是fail了
给你一堆ads(广告),和一个广告,以及一个现成的function可以用来算出两个广告
之间的similarity, similarity是一个0到100的整数。(0是最similar的)
要求在这一堆广告里面找出和这个广告最similar的k个广告
avatar
x*p
2
2012最后一天收到的,早上是clock stop,下午变成了approval。
12/10 mailed to TSC
12/11 delivered to TSC
12/13 RD (NO EMAIL SENT TO LAWYER OR EMPLOYER,
only EMPLOYER received Receipt Notice by mail on 12/20/2012)
12/20 PP filed
12/26 PP clock started
12/31 AD
找的郭律师,很认真负责和实在,回信回电话很及时,对推荐信要求比较严格,花了很
长那个时间,也许是我理解能力不行,但是按照要求写完前几封就好写多了。
希望自己485早日file,早日approve!
从这版上了解了很多信息,谢谢大家,也希望版上所有人新的一年都能够有好消息,心
想事成!
avatar
z*e
3
top k question阿
建heap
avatar
w*s
4
cong
avatar
z*e
5
top k看来是最近的必考题
avatar
l*l
6
cong
avatar
S*1
7
这是二爷的组啊,呼唤二爷....
avatar
I*r
8
Cong
avatar
q*c
9
是二爷面的吧。

【在 d**k 的大作中提到】
: 昨天面的,估计我没有达到考官的预期值,应该是fail了
: 给你一堆ads(广告),和一个广告,以及一个现成的function可以用来算出两个广告
: 之间的similarity, similarity是一个0到100的整数。(0是最similar的)
: 要求在这一堆广告里面找出和这个广告最similar的k个广告

avatar
c*n
10
cong
avatar
d*k
11
不是,二爷给递进去的
面的应该不是中国人
有口音,应该也不是老美

【在 q********c 的大作中提到】
: 是二爷面的吧。
avatar
s*6
12
恭喜
avatar
d*k
13
晕死
我天天在版上看,怎么就没看到这个必考题呢

【在 z****e 的大作中提到】
: top k看来是最近的必考题
avatar
L*S
14
gxgx!

【在 x******p 的大作中提到】
: 2012最后一天收到的,早上是clock stop,下午变成了approval。
: 12/10 mailed to TSC
: 12/11 delivered to TSC
: 12/13 RD (NO EMAIL SENT TO LAWYER OR EMPLOYER,
: only EMPLOYER received Receipt Notice by mail on 12/20/2012)
: 12/20 PP filed
: 12/26 PP clock started
: 12/31 AD
: 找的郭律师,很认真负责和实在,回信回电话很及时,对推荐信要求比较严格,花了很
: 长那个时间,也许是我理解能力不行,但是按照要求写完前几封就好写多了。

avatar
M*a
15
lz几年工作经验啦。
avatar
l*2
16
GXGX!
avatar
j*3
17
马克
avatar
d*n
18
恭喜

【在 x******p 的大作中提到】
: 2012最后一天收到的,早上是clock stop,下午变成了approval。
: 12/10 mailed to TSC
: 12/11 delivered to TSC
: 12/13 RD (NO EMAIL SENT TO LAWYER OR EMPLOYER,
: only EMPLOYER received Receipt Notice by mail on 12/20/2012)
: 12/20 PP filed
: 12/26 PP clock started
: 12/31 AD
: 找的郭律师,很认真负责和实在,回信回电话很及时,对推荐信要求比较严格,花了很
: 长那个时间,也许是我理解能力不行,但是按照要求写完前几封就好写多了。

avatar
d*k
19
why?

【在 M**a 的大作中提到】
: lz几年工作经验啦。
avatar
r*r
20
cong

【在 x******p 的大作中提到】
: 2012最后一天收到的,早上是clock stop,下午变成了approval。
: 12/10 mailed to TSC
: 12/11 delivered to TSC
: 12/13 RD (NO EMAIL SENT TO LAWYER OR EMPLOYER,
: only EMPLOYER received Receipt Notice by mail on 12/20/2012)
: 12/20 PP filed
: 12/26 PP clock started
: 12/31 AD
: 找的郭律师,很认真负责和实在,回信回电话很及时,对推荐信要求比较严格,花了很
: 长那个时间,也许是我理解能力不行,但是按照要求写完前几封就好写多了。

avatar
w*r
21
找关键词?广告之间有什么联系啊
avatar
g*1
22
cong

【在 x******p 的大作中提到】
: 2012最后一天收到的,早上是clock stop,下午变成了approval。
: 12/10 mailed to TSC
: 12/11 delivered to TSC
: 12/13 RD (NO EMAIL SENT TO LAWYER OR EMPLOYER,
: only EMPLOYER received Receipt Notice by mail on 12/20/2012)
: 12/20 PP filed
: 12/26 PP clock started
: 12/31 AD
: 找的郭律师,很认真负责和实在,回信回电话很及时,对推荐信要求比较严格,花了很
: 长那个时间,也许是我理解能力不行,但是按照要求写完前几封就好写多了。

avatar
d*k
23
不是让你算联系
算联系的function是给定的,直接调用就行
主要还是输出kth elements

【在 w****r 的大作中提到】
: 找关键词?广告之间有什么联系啊
avatar
a*n
24
gxgx
avatar
w*r
25
那你讲讲吧,学习学习

【在 d**k 的大作中提到】
: 不是让你算联系
: 算联系的function是给定的,直接调用就行
: 主要还是输出kth elements

avatar
B*a
26
恭喜

【在 x******p 的大作中提到】
: 2012最后一天收到的,早上是clock stop,下午变成了approval。
: 12/10 mailed to TSC
: 12/11 delivered to TSC
: 12/13 RD (NO EMAIL SENT TO LAWYER OR EMPLOYER,
: only EMPLOYER received Receipt Notice by mail on 12/20/2012)
: 12/20 PP filed
: 12/26 PP clock started
: 12/31 AD
: 找的郭律师,很认真负责和实在,回信回电话很及时,对推荐信要求比较严格,花了很
: 长那个时间,也许是我理解能力不行,但是按照要求写完前几封就好写多了。

avatar
d*k
27
我没有答对阿
不过楼上不时有人说
建size 为k的max heap
把所有的n个similarity扔进去再取出来

【在 w****r 的大作中提到】
: 那你讲讲吧,学习学习
avatar
e*p
28
gxgx!
avatar
w*r
29
那和排序找最大的有什么区别啊

【在 d**k 的大作中提到】
: 我没有答对阿
: 不过楼上不时有人说
: 建size 为k的max heap
: 把所有的n个similarity扔进去再取出来

avatar
H*1
30
恭喜

【在 x******p 的大作中提到】
: 2012最后一天收到的,早上是clock stop,下午变成了approval。
: 12/10 mailed to TSC
: 12/11 delivered to TSC
: 12/13 RD (NO EMAIL SENT TO LAWYER OR EMPLOYER,
: only EMPLOYER received Receipt Notice by mail on 12/20/2012)
: 12/20 PP filed
: 12/26 PP clock started
: 12/31 AD
: 找的郭律师,很认真负责和实在,回信回电话很及时,对推荐信要求比较严格,花了很
: 长那个时间,也许是我理解能力不行,但是按照要求写完前几封就好写多了。

avatar
d*k
31
省点点时间吧

【在 w****r 的大作中提到】
: 那和排序找最大的有什么区别啊
avatar
G*n
32
Big cong!
avatar
w*r
33
没看出来省了,你说说怎么省了

【在 d**k 的大作中提到】
: 省点点时间吧
avatar
d*g
34
cong and bless your 485!
avatar
d*k
35
好像确实也不省阿

【在 w****r 的大作中提到】
: 没看出来省了,你说说怎么省了
avatar
n*s
36
gxgx!
avatar
W*y
37
locality sensitive hashing
avatar
c*l
38
Gx

★ 发自iPhone App: ChineseWeb 7.7

【在 x******p 的大作中提到】
: 2012最后一天收到的,早上是clock stop,下午变成了approval。
: 12/10 mailed to TSC
: 12/11 delivered to TSC
: 12/13 RD (NO EMAIL SENT TO LAWYER OR EMPLOYER,
: only EMPLOYER received Receipt Notice by mail on 12/20/2012)
: 12/20 PP filed
: 12/26 PP clock started
: 12/31 AD
: 找的郭律师,很认真负责和实在,回信回电话很及时,对推荐信要求比较严格,花了很
: 长那个时间,也许是我理解能力不行,但是按照要求写完前几封就好写多了。

avatar
v*y
39
如果面试官期待的是heap的算法的话,这个题真的不难。类似的题还有很多啊,什么找
出用户访问最多的k个网站,离原点最近的k个点……
楼上说的locality sensitive hashing能给讲讲吗?
avatar
L*u
40
Cong~
avatar
d*k
41
我不知道他是要heap还是quick selection
但是如果是要heap, 我岂不是还是自己实现一个heap insert function?

【在 v*****y 的大作中提到】
: 如果面试官期待的是heap的算法的话,这个题真的不难。类似的题还有很多啊,什么找
: 出用户访问最多的k个网站,离原点最近的k个点……
: 楼上说的locality sensitive hashing能给讲讲吗?

avatar
l*2
42
GXGX!
avatar
g*7
43
排序是nlog(n), Heap是nlog(k)

【在 d**k 的大作中提到】
: 好像确实也不省阿
avatar
v*y
44
至于时间和空间,当然比排序好的多了,排序时nlogn,用heap的话是nlogk,空间也只
用k
avatar
v*y
45

priorityQueue啊,除非面试官不同意。

【在 d**k 的大作中提到】
: 我不知道他是要heap还是quick selection
: 但是如果是要heap, 我岂不是还是自己实现一个heap insert function?

avatar
g*e
46
当然是用quick select比较快
heap的方法太straight forward
avatar
d*k
47
用heap也可以做成 klog(n)
这俩哪个更省?

【在 g*******7 的大作中提到】
: 排序是nlog(n), Heap是nlog(k)
avatar
l*a
48
怎么看出来的呢?
二爷不给我递。。。:(

【在 S******1 的大作中提到】
: 这是二爷的组啊,呼唤二爷....
avatar
z*e
49
二爷的组还不好认?
二爷天天挂嘴边的nodejs和clojure
其他组一般不做要求
只有他们组在用,尤其是clojure
big data组要求etl&hibernate
goods组也不要求
很容易区分

【在 l*****a 的大作中提到】
: 怎么看出来的呢?
: 二爷不给我递。。。:(

avatar
z*e
50
klog(n)的话消耗的空间太夸张
不可能建一个复杂度为n或者是跟n有关的内存块
因为n往往意味着大数据,默认是内存装不下
k远小于n,一般都是log(k)*n
读n用streaming

【在 d**k 的大作中提到】
: 用heap也可以做成 klog(n)
: 这俩哪个更省?

avatar
l*1
51
这个题我做了,我开始也说的是heap,然后要求提高,你应该问他similarity如何定义
,他会告诉你是(1-100),然后他期待的其实是类似桶排序的。
avatar
l*1
52
这个题我做了,我开始也说的是heap,然后要求提高,你应该问他similarity如何定义
,他会告诉你是(1-100),然后他期待的其实是类似桶排序的。
avatar
b*t
53
similarity没有相同的值才能桶排序吧?如果有最小的k个similarity都是1,怎么桶排
序?

【在 l********1 的大作中提到】
: 这个题我做了,我开始也说的是heap,然后要求提高,你应该问他similarity如何定义
: ,他会告诉你是(1-100),然后他期待的其实是类似桶排序的。

avatar
l*1
54
相同的就放在后面的链表里,你找到k个后自动返回就好。

【在 b*********t 的大作中提到】
: similarity没有相同的值才能桶排序吧?如果有最小的k个similarity都是1,怎么桶排
: 序?

avatar
z*e
55
我觉得水桶排序这里的理解可能是map reduce

【在 b*********t 的大作中提到】
: similarity没有相同的值才能桶排序吧?如果有最小的k个similarity都是1,怎么桶排
: 序?

avatar
l*1
56
最后不用真正的排序,从水桶后往前找k个元素

【在 z****e 的大作中提到】
: 我觉得水桶排序这里的理解可能是map reduce
avatar
S*A
57
我觉得counting sort也可以啊,要是数很多的话用radix sort也行啊。

:这个题我做了,我开始也说的是heap,然后要求提高,你应该问他similarity如何定
义,他会告诉你是(1-100),然后他期待的其实是类似桶排序的。
……

【在 l********1 的大作中提到】
: 最后不用真正的排序,从水桶后往前找k个元素
avatar
b*t
58
链表可以,这样可以做到O(n),应该是最快了

【在 l********1 的大作中提到】
: 相同的就放在后面的链表里,你找到k个后自动返回就好。
avatar
z*e
59
那就是先通过分clustering来归类大数据?
用这种方式来优化n
把n变成lgn
最后是lgk * lg n

【在 l********1 的大作中提到】
: 最后不用真正的排序,从水桶后往前找k个元素
avatar
l*1
60
恩 我就是提到 bucket sort和radix sort后,面试官好像觉得还不错,我就继续说了。

【在 S***A 的大作中提到】
: 我觉得counting sort也可以啊,要是数很多的话用radix sort也行啊。
:
: :这个题我做了,我开始也说的是heap,然后要求提高,你应该问他similarity如何定
: 义,他会告诉你是(1-100),然后他期待的其实是类似桶排序的。
: ……

avatar
z*e
61
所以key是grouping?

了。

【在 l********1 的大作中提到】
: 恩 我就是提到 bucket sort和radix sort后,面试官好像觉得还不错,我就继续说了。
avatar
S*A
62
相同的值可以放在一个bucket里啊

:similarity没有相同的值才能桶排序吧?如果有最小的k个similarity都是1,怎么桶
排序?


:【 在 leetcoder1 (mitbbsCoder) 的大作中提到: 】
:: 这个题我做了,我开始也说的是heap,然后要求提高,你应该问他similarity如何
定义
:: ,他会告诉你是(1-100),然后他期待的其实是类似桶排序的。

……

【在 b*********t 的大作中提到】
: 链表可以,这样可以做到O(n),应该是最快了
avatar
z*e
63
我大概明白了
heap没有错
这是第一步,复杂度是lg k * n
但是n太大,可以进一步降低n的复杂度
这个时候用top down方式
随便你用,就是分成一堆的clustering
这样你就可以不用遍历所有的n
而可以只找你想要的那一个group里面的数据就好了
这个可以提前做点处理,比如对于similarity是0-9的集中存放
10-19的放另外一个group,然后找的时候,就找0-9这个group就好了
avatar
z*e
64
sim是相互
a和b相似,b和a也相似
所以先看你这个广告在哪个group里面
然后就找这个group
big data说这个就是cluster
avatar
z*e
65
ln k是算法复杂度
n怎么处理是统计
big data处理第一步就是找similarity
这个组是big data组?
avatar
S*A
66
too optimistic,你怎么知道你的一个group会/不会cover k个值?

:我大概明白了
:heap没有错
:这是第一步,复杂度是lg k * n
:但是n太大,可以进一步降低n的复杂度
:这个时候用top down方式
:随便你用,就是分成一堆的clustering
:这样你就可以不用遍历所有的n
……

【在 z****e 的大作中提到】
: ln k是算法复杂度
: n怎么处理是统计
: big data处理第一步就是找similarity
: 这个组是big data组?

avatar
z*e
67
假设当然是k<k非常小,比如10,20这种
n非常大,几十万肯定不只,几百万至少了

【在 S***A 的大作中提到】
: too optimistic,你怎么知道你的一个group会/不会cover k个值?
:
: :我大概明白了
: :heap没有错
: :这是第一步,复杂度是lg k * n
: :但是n太大,可以进一步降低n的复杂度
: :这个时候用top down方式
: :随便你用,就是分成一堆的clustering
: :这样你就可以不用遍历所有的n
: ……

avatar
S*A
68
你没明白我的意思,假设k为100,你第一个bucket装了10个,第二个装了30,第三个可
能没有,第四个装了80个,你怎么找呢?而且你可能不知道哪个bucket里装多少吧?

:假设当然是k<<n啦
:k非常小,比如10,20这种
:n非常大,几十万肯定不只,几百万至少了
:【 在 SEKKA (努力备考中......) 的大作中提到: 】
:: too optimistic,你怎么知道你的一个group会/不会cover k个值?
:: :我大概明白了
:: :heap没有错
……

【在 z****e 的大作中提到】
: 假设当然是k<: k非常小,比如10,20这种
: n非常大,几十万肯定不只,几百万至少了

avatar
z*e
69
想到这里有种豁然开朗的感觉
接轨了
avatar
S*A
70
我觉得这道题你说出O(n)的算法就行了吧。

:假设当然是k<<n啦
:k非常小,比如10,20这种
:n非常大,几十万肯定不只,几百万至少了
:【 在 SEKKA (努力备考中......) 的大作中提到: 】
:: too optimistic,你怎么知道你的一个group会/不会cover k个值?
:: :我大概明白了
:: :heap没有错
……

【在 z****e 的大作中提到】
: 想到这里有种豁然开朗的感觉
: 接轨了

avatar
z*e
71
你没看懂我的意思
我没有说heap是错的,还是用heap对付内存
你没有必要改成桶排序,对于内存里面的k个数据来说
我对n做处理,而不是k
我说的不是算法,或者不是简单的heap, bucket这种内存算法
优化也不见得只能优化内存呀

【在 S***A 的大作中提到】
: 你没明白我的意思,假设k为100,你第一个bucket装了10个,第二个装了30,第三个可
: 能没有,第四个装了80个,你怎么找呢?而且你可能不知道哪个bucket里装多少吧?
:
: :假设当然是k<<n啦
: :k非常小,比如10,20这种
: :n非常大,几十万肯定不只,几百万至少了
: :【 在 SEKKA (努力备考中......) 的大作中提到: 】
: :: too optimistic,你怎么知道你的一个group会/不会cover k个值?
: :: :我大概明白了
: :: :heap没有错

avatar
z*e
72
我觉得可以,我面肯定过了

【在 S***A 的大作中提到】
: 我觉得这道题你说出O(n)的算法就行了吧。
:
: :假设当然是k<<n啦
: :k非常小,比如10,20这种
: :n非常大,几十万肯定不只,几百万至少了
: :【 在 SEKKA (努力备考中......) 的大作中提到: 】
: :: too optimistic,你怎么知道你的一个group会/不会cover k个值?
: :: :我大概明白了
: :: :heap没有错
: ……

avatar
L*s
73
整数,那就计数排序好了
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。