Redian新闻
>
最近一次入境美国是从加拿大,485填表疑问,谢谢!
avatar
最近一次入境美国是从加拿大,485填表疑问,谢谢!# Immigration - 落地生根
c*z
1
【 以下文字转载自 Statistics 讨论区 】
发信人: chaoz (面朝大海,吃碗凉皮), 信区: Statistics
标 题: 杂七杂八的一些面经
发信站: BBS 未名空间站 (Sat Sep 28 23:06:01 2013, 美东)
因为我这个人面试得有点乱七八糟,从stat到SDE到PM到DS都有,就一路想到哪里贴到
哪里了,抱歉抱歉。
有意义的题不多,基本上都是设计题性质,给一个case让我做,多半还是open case。
先贴题目,反正答案我自己忘记的差不多了。
Q0:讲讲你最得意的一个project。
Q1:有一组数据,很长,有ID,经纬度,时间4个变量。怎么找出两人是否有一面之缘
。怎么找出所有relationship(定义是在100米范围内一起度过1小时以上)。
Q2:有一组以往marketing campaign的数据,包括使用的关键词集合,目录集合,还有
成功率。怎么决定下次campaign使用哪些关键词。
Q3:怎么找出竞争对手购买了哪些搜索关键词。
Q4:怎么判断两个TB级别的文本是否雷同,是否近似。
Q5:怎么用C实现SQL的join功能。只是思路(hash),没让code。
Q6:三个按钮对应隔壁房间的三盏灯,只能到隔壁房间一次,怎么判断哪个对应哪个。
Q7:怎么用两个正方体(共12面)显示一个月的所有日期。
Q8:怎么最快的在一个大文本里面搜索字符串。
Q9:为什么有时候K means算法不能converge?
Q10:沙滩上有两个一模一样的冰激凌店,由两兄弟经营。为了竞争顾客,他们会把店
开到哪里?
Q11:纽约有多少出租车?他们年收入大概多少?
Q12:某公司在各种marketing channel投入资金,请问怎么计算投资回报?怎么决定最
佳投资方案?
Q13:(唯一的一个code题)计算斐波那契数列。
Q14:怎么设计recommending system,怎么解决cold start 问题。
Q15:假设你既卖toyota又卖lexus,请问应该如何定价?
Q16:怎么解决marketing data里面selection bias问题(从impression到click到
purchase,每次都只有少数人进入下一步)。
Q17:使用decision tree的时候,假设y应该随着x递增,但是cart算法得出的结果有
spike,即某处出现y随着x递减的现象。怎么解决?
Q18:怎么判断sample是否符合预设的population 分布。
Q19:假设盒子里有1000条鞋带,每次拿出两个头系起来,如果形成一个loop就拿出来
,否则放回去。请问预期最后有几个环。
Q20:有一个人口调查问题是家里有几口人,显然最后的结果会有重复,因为4口之家每
个人都会说4。怎么解决?
想起来再加。
avatar
k*c
2
请教大家,最近一次入境美国是从加拿大,但用的过期的美国签证(F-1)和有效的H-
1B I-797(Automatic Revalidation)。入关时,没有给新的I-94 卡,但护照上面戳有
入境图章和写有H1-B的有效时间。
现在填I-485,问 place of last entry into the united states, 我填了加拿大的入
境城市。但下面的问题问Visa number, issue data 和 issue consulate,请教应该
怎么填,是N/A还是填我上次过期的美签信息?
谢谢!
avatar
u*o
3
我记得lz拿到很好的offer对不?恭喜了。。
不过这些题都好灵活的说。。。怎么答啊?
Q4:怎么判断两个TB级别的文本是否雷同,是否近似。
是不是用bag of word判断近似?
或者在random place取点,看是否一样?
Q10:沙滩上有两个一模一样的冰激凌店,由两兄弟经营。为了竞争顾客,他们会把店
开到哪里?
这个是不是应该开到第一象限和第三象限的center?
Q20:有一个人口调查问题是家里有几口人,显然最后的结果会有重复,因为4口之家每
个人都会说4。怎么解决?
这个是不是应该把成员名字写出来,然后找loop,比如a-b-c-d都会说这同样的四个人?
avatar
l*l
4
我觉得应该填过期的visa信息,因为你没有新的签证,去加拿大不需要重新办美国签证。
485我不知道,但是我办opt的时候学校isso的人是这么跟我说的
avatar
s*l
5
> Q9:为什么有时候K means算法不能converge?
http://en.wikipedia.org/wiki/K-means_clustering
The algorithm has converged when the assignments no longer change. Since
both steps optimize the WCSS objective, and there only exists a finite
number of such partitionings, the algorithm MUST converge to a (local)
optimum. There is NO guarantee that the global optimum is found using this
algorithm.
...
As it is a heuristic algorithm, there is no guarantee that it will converge
to the global optimum, and the result may depend on the initial clusters. As
the algorithm is usually very fast, it is common to run it multiple times
with different starting conditions. However, in the worst case, k-means can
be very slow to converge: in particular it has been shown that there exist
certain point sets, even in 2 dimensions, on which k-means takes exponential
time, that is 2Ω(n), to converge.[10] These point sets do not seem to
arise in practice: this is corroborated by the fact that the smoothed
running time of k-means is polynomial.[11]
...
The two key features of k-means which make it efficient are often regarded
as its biggest drawbacks:
- Euclidean distance is used as a metric and variance is used as a measure
of cluster scatter.
- The number of clusters k is an input parameter: an inappropriate choice of
k may yield poor results. That is why, when performing k-means, it is
important to run diagnostic checks for determining the number of clusters in
the data set.
- Convergence to a local minimum may produce counterintuitive ("wrong")
results (see example in Fig.).
avatar
k*e
6

this is correct.
但下面的问题问Visa number, issue data 和 issue consulate,请教应该
填上次过期的签证信息

【在 k**c 的大作中提到】
: 请教大家,最近一次入境美国是从加拿大,但用的过期的美国签证(F-1)和有效的H-
: 1B I-797(Automatic Revalidation)。入关时,没有给新的I-94 卡,但护照上面戳有
: 入境图章和写有H1-B的有效时间。
: 现在填I-485,问 place of last entry into the united states, 我填了加拿大的入
: 境城市。但下面的问题问Visa number, issue data 和 issue consulate,请教应该
: 怎么填,是N/A还是填我上次过期的美签信息?
: 谢谢!

avatar
m*b
7
Q3: 打个比方,如果竞争对手是在用LinkedIn招人,那么用他们所有新招的人的
LinkedIn Profile 统计他们的特点关键词?
Q4: 统计每个文本中所有词出现的比例,用最频繁出现的词的比例计算量文本之间的距
离。越小越接近?
Q5: 随便开个灯,让他变热。然后关灯,开另一个开关,拍过去看? (脑经急转弯?)
Q7: 两个六进制数表示28-31种变化应该没问题?
Q8: Hadoop并行搜索? (joking ..)
Q10: 若需考虑沙滩形状和人口密度,感觉应该是要设在重心上?
Q11: 根据各区面积和人口密度设计抽样方案? (问政府?)
Q19: 排列组合题。穷举所有可能性,用Matlab算出来的大概500左右?

【在 c***z 的大作中提到】
: 【 以下文字转载自 Statistics 讨论区 】
: 发信人: chaoz (面朝大海,吃碗凉皮), 信区: Statistics
: 标 题: 杂七杂八的一些面经
: 发信站: BBS 未名空间站 (Sat Sep 28 23:06:01 2013, 美东)
: 因为我这个人面试得有点乱七八糟,从stat到SDE到PM到DS都有,就一路想到哪里贴到
: 哪里了,抱歉抱歉。
: 有意义的题不多,基本上都是设计题性质,给一个case让我做,多半还是open case。
: 先贴题目,反正答案我自己忘记的差不多了。
: Q0:讲讲你最得意的一个project。
: Q1:有一组数据,很长,有ID,经纬度,时间4个变量。怎么找出两人是否有一面之缘

avatar
b*e
8
这个问题在485板有回答。

【在 k**c 的大作中提到】
: 请教大家,最近一次入境美国是从加拿大,但用的过期的美国签证(F-1)和有效的H-
: 1B I-797(Automatic Revalidation)。入关时,没有给新的I-94 卡,但护照上面戳有
: 入境图章和写有H1-B的有效时间。
: 现在填I-485,问 place of last entry into the united states, 我填了加拿大的入
: 境城市。但下面的问题问Visa number, issue data 和 issue consulate,请教应该
: 怎么填,是N/A还是填我上次过期的美签信息?
: 谢谢!

avatar
h*3
9
楼主的面试题很有点意思,其中还居然涉及到了importance sampling,KL divergence,
recommender的东西。
avatar
k*e
10
hehe, i also answered here and i guarantee the answer is correct :-)

【在 b*******e 的大作中提到】
: 这个问题在485板有回答。
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。