Redian新闻
>
求科普,寄生虫是怎么进化出来的
avatar
求科普,寄生虫是怎么进化出来的# Joke - 肚皮舞运动
a*s
1
上周五的onsitee,只刷过三道leetcode题目,硬着头皮上了。免得是大数据platform
组SMTS,挂了,不知道谁黑的。
一个俄国小哥:
比较热情, 先问了stack用linklist和array实现的优缺点,然后问了如何用二维数组
存储神经网络,比较耐心的引导类型,最后时间没有了,就只讨论了一下为什么这么做
。俺提出了一些可能的;
印度人:
上来很详细的问了以前的做的东西,HIVE如何转化成TEZ的,TEZ和MAPREDUCE的性能区
别,Slider提交任务需要那三个文件,我说就是三个json文件关于资源请求,可执行文
件等等,半年前作的实在记不清了,他解释说是metainfo.xml, 和两个json文件,俺
就极力说服他,please检查slider的apache JIRA buglist,现在俺还有几个ticket要
解决,他说他会。没让写code
一个国人伯克利小伙子:
随便问了问以前的项目,然后让做题, 给两个string,一个str1,一个str2,找出
str1里所有的str2
出现的第一个位置:比如ababab,ab那么返回数组[0,2,4]。先让写testcase,都
写出来了,提示我有一个情况没写,俺解释说已经出现过了。然后坑坑粑粑的写完了程
序,时间到了,他说程序没问题
跟经理吃饭,behavior问题
美国人:
问了一个给定一分,二分,五分的硬币,如何给一个数字x,那么如何用最少的coin来
表示x:
俺分析了greedy algorithm,先跟5分取余,在跟2余,在1余,把除数加起来就是了。
然后改成1分,3。5分,5分,如何做?俺先想了probablilty的决策树,然后被direct
回图论,后来就是BFS,然后俺提出了一些优化方案,比如,如果跟3.5取余还有.5余数
,那么这一个分支就不用traverse了。
国人大哥:
系统设计:一个threadpoolexecutor的queue很多put,dispatcher在get,如果put很多
怎么办,要写个method,一个是put一个是get,俺先想了如果queue full了需要那么
put方法sleep,sleep时间可以采用fabnacci数列,但是有最大值限制,达到最大值后
再返回,因为queue的访问服从possion分布,后来问如何马上让put的线程知道。我说
我们可以用wait和notifyall,但是没用过,他比较nice的说这个很简单,但是你没用
过,我们问个别的吧。
问了个string permutation问题,
a:
ab: ab,ba
abc: abc,acb,cab,bac,bca,cba
俺给了recursion方法,花的时间有点久,后来写的没时间了,跟他想的方法不太一样
,但是equavilent。
经理:
设计题:
1.如果slider提交的container继续trigger AM,那么YARN的RM会不会负责fault-
tolerance,答案是如果这个container提交AM时通过slider, yes,如果不是,NO。
2. 使用YARN+SLIDER,如何保证applicationMaster是可以trace的,如果发生failure
,如何再次找到AM。刚开始俺说你保存到数据库,后来发现他问的是同一个
application,就告诉他说,YARN的RM会提供RESTAPI,直接用applicationID就可以找
到application master的host地址和port,YARN命令行也可以。他问为啥之前没想到
RESTAPI,俺说没理解你问的是同一个application
3. 给一个系统,如何准确的找出第一百万个用户click。
俺先系统的给了一个设计三角形,定点依次是:时间,空间和精确度,告诉他,图灵机
的设计如果需要节省时间,那么需要牺牲空间和精确度,对于需要节省空间和提高精确
度类似。当然时间是有最小值的,不是完全能用空间和精确度来trade的。等等。 然后
开始设计。
俺提供了如下方案:
a. memcache 或是redis类似的分布式kv数据结构。
b. 分布式系统的同步方法,就是第一个发送自己的数量和一个atomtic
incrementalvalue,然后第二个收到后,加上自己的数,再increase the 个counter,
以此类推。他说如果网络如果很忙,cluster足够大,俺就说,你是不是想减少通信次
数,就提供了MPI使用的REDUCE机制只需要log(n)步,然后他加入了failure,俺说那
可能需要加入冗余, 因为failure的基本解决原则就是冗余。
c. 后来又提出可以在前端loadbalancer内部加入cache,几集cache, write back or
write through等方法的优劣。
今天给经理发信,说是挂了,没给原因,大家帮忙分析一下为啥,谢谢。
avatar
a*b
2
avatar
t*m
3
尤其是那些离开宿主就死的。一开始也不会在宿主体内无中生有吧?
avatar
l*n
4
我觉得你回答的很不错
要不是有刷题把这个bar弄的这么高
你这经验没问题

platform

【在 a*****s 的大作中提到】
: 上周五的onsitee,只刷过三道leetcode题目,硬着头皮上了。免得是大数据platform
: 组SMTS,挂了,不知道谁黑的。
: 一个俄国小哥:
: 比较热情, 先问了stack用linklist和array实现的优缺点,然后问了如何用二维数组
: 存储神经网络,比较耐心的引导类型,最后时间没有了,就只讨论了一下为什么这么做
: 。俺提出了一些可能的;
: 印度人:
: 上来很详细的问了以前的做的东西,HIVE如何转化成TEZ的,TEZ和MAPREDUCE的性能区
: 别,Slider提交任务需要那三个文件,我说就是三个json文件关于资源请求,可执行文
: 件等等,半年前作的实在记不清了,他解释说是metainfo.xml, 和两个json文件,俺

avatar
c*8
5
白菜心是股版的吉祥鸟,啄木鸟。。。
呵呵
avatar
l*d
6
退化,不是进化
avatar
b*5
7
workday 要屁个大数据??!!
现在面经, 越来越难。。。
avatar
a*b
8
LOL

【在 c******8 的大作中提到】
: 白菜心是股版的吉祥鸟,啄木鸟。。。
: 呵呵

avatar
M*P
9
基本没啥离开寄主就死的吧

★ 发自iPhone App: ChineseWeb 7.8

【在 t***m 的大作中提到】
: 尤其是那些离开宿主就死的。一开始也不会在宿主体内无中生有吧?
avatar
e*a
10
Although LZ has plenty of experience,
probably the hiring bar is becoming very high only for Chinese.
avatar
K*2
11
蛔虫绦虫那些都具顽强
连小强见了都只能自叹不如 因为小强自己也被寄生

【在 t***m 的大作中提到】
: 尤其是那些离开宿主就死的。一开始也不会在宿主体内无中生有吧?
avatar
a*s
12
多谢牛肉姐鼓励。

【在 b**********5 的大作中提到】
: workday 要屁个大数据??!!
: 现在面经, 越来越难。。。

avatar
l*e
13
退化出来的,本来都能独立生存,后来发现寄生不错,有吃有喝不用干活,其他功能就
退化了
感觉在说某些人一样。。。
avatar
a*s
14
另外他家说不给办H1b,只办transfer。希望对后来人有帮助。
avatar
t*m
15
有没有没退化的?没有自然选择的压力要退化呀。

【在 l*******e 的大作中提到】
: 退化出来的,本来都能独立生存,后来发现寄生不错,有吃有喝不用干活,其他功能就
: 退化了
: 感觉在说某些人一样。。。

avatar
f*r
16
Move on. 祝LZ早日拿大offer

上周五的onsitee,只刷过三道leetcode题目,硬着头皮上了。免得是大数据platform
组SMTS,挂了,不知道谁黑的。
一个俄国小哥:
比较热情, 先问了stack用linklist和array实现的优缺点,然后问了如何用二维数组
存储神经网络,比较耐心的引导类型,最后时间没有了,就只讨论了一下为什么这么做
。俺提出了一些可能的;
印度人:
上来很详细的问了以前的做的东西,HIVE如何转化成TEZ的,TEZ和MAPREDUCE的性能区
别,Slider提交任务需要那三个文件,我说就是三个json文件关于资源请求,可执行文
件等等,半年前作的实在记不清了,他解释说是metainfo.xml, 和两个json文件,俺
就极力说服他,please检查slider的apache JIRA buglist,现在俺还有几个ticket要
解决,他说他会。没让写code
一个国人伯克利小伙子:
随便问了问以前的项目,然后让做题, 给两个string,一个str1,一个str2,找出
str1里所有的str2
出现的第一个位置:比如ababab,ab那么返回数组[0,2,4]。先让写testcase,都
写出来了,提示我有一个情况没写,俺解释说已经出现过了。然后坑坑粑粑的写完了程
序,时间到了,他说程序没问题
跟经理吃饭,behavior问题
美国人:
问了一个给定一分,二分,五分的硬币,如何给一个数字x,那么如何用最少的coin来
表示x:
俺分析了greedy algorithm,先跟5分取余,在跟2余,在1余,把除数加起来就是了。
然后改成1分,3。5分,5分,如何做?俺先想了probablilty的决策树,然后被direct
回图论,后来就是BFS,然后俺提出了一些优化方案,比如,如果跟3.5取余还有.5余数
,那么这一个分支就不用traverse了。
国人大哥:
系统设计:一个threadpoolexecutor的queue很多put,dispatcher在get,如果put很多
怎么办,要写个method,一个是put一个是get,俺先想了如果queue full了需要那么
put方法sleep,sleep时间可以采用fabnacci数列,但是有最大值限制,达到最大值后
再返回,因为queue的访问服从possion分布,后来问如何马上让put的线程知道。我说
我们可以用wait和notifyall,但是没用过,他比较nice的说这个很简单,但是你没用
过,我们问个别的吧。
问了个string permutation问题,
a:
ab: ab,ba
abc: abc,acb,cab,bac,bca,cba
俺给了recursion方法,花的时间有点久,后来写的没时间了,跟他想的方法不太一样
,但是equavilent。
经理:
设计题:
1.如果slider提交的container继续trigger AM,那么YARN的RM会不会负责fault-
tolerance,答案是如果这个container提交AM时通过slider, yes,如果不是,NO。
2. 使用YARN+SLIDER,如何保证applicationMaster是可以trace的,如果发生failure
,如何再次找到AM。刚开始俺说你保存到数据库,后来发现他问的是同一个
application,就告诉他说,YARN的RM会提供RESTAPI,直接用applicationID就可以找
到application master的host地址和port,YARN命令行也可以。他问为啥之前没想到
RESTAPI,俺说没理解你问的是同一个application
3. 给一个系统,如何准确的找出第一百万个用户click。
俺先系统的给了一个设计三角形,定点依次是:时间,空间和精确度,告诉他,图灵机
的设计如果需要节省时间,那么需要牺牲空间和精确度,对于需要节省空间和提高精确
度类似。当然时间是有最小值的,不是完全能用空间和精确度来trade的。等等。 然后
开始设计。
俺提供了如下方案:
a. memcache 或是redis类似的分布式kv数据结构。
b. 分布式系统的同步方法,就是第一个发送自己的数量和一个atomtic
incrementalvalue,然后第二个收到后,加上自己的数,再increase the 个counter,
以此类推。他说如果网络如果很忙,cluster足够大,俺就说,你是不是想减少通信次
数,就提供了MPI使用的REDUCE机制只需要log(n)步,然后他加入了failure,俺说那
可能需要加入冗余, 因为failure的基本解决原则就是冗余。
c. 后来又提出可以在前端loadbalancer内部加入cache,几集cache, write back or
write through等方法的优劣。
今天给经理发信,说是挂了,没给原因,大家帮忙分析一下为啥,谢谢。

【在 a*****s 的大作中提到】
: 上周五的onsitee,只刷过三道leetcode题目,硬着头皮上了。免得是大数据platform
: 组SMTS,挂了,不知道谁黑的。
: 一个俄国小哥:
: 比较热情, 先问了stack用linklist和array实现的优缺点,然后问了如何用二维数组
: 存储神经网络,比较耐心的引导类型,最后时间没有了,就只讨论了一下为什么这么做
: 。俺提出了一些可能的;
: 印度人:
: 上来很详细的问了以前的做的东西,HIVE如何转化成TEZ的,TEZ和MAPREDUCE的性能区
: 别,Slider提交任务需要那三个文件,我说就是三个json文件关于资源请求,可执行文
: 件等等,半年前作的实在记不清了,他解释说是metainfo.xml, 和两个json文件,俺

avatar
t*m
17
有些至少在某些阶段不能离开吧

【在 M*P 的大作中提到】
: 基本没啥离开寄主就死的吧
:
: ★ 发自iPhone App: ChineseWeb 7.8

avatar
I*x
18
确实是这样的,在career fair上明确说的。

【在 a*****s 的大作中提到】
: 另外他家说不给办H1b,只办transfer。希望对后来人有帮助。
avatar
H*7
19
退化就是一种进化啊,文理科生们啊
avatar
h*a
20
lz,我小声提醒一下哈,那个硬币的问题,你那种解法不对滴,该用dp的。
http://www.mitbbs.com/article_t/JobHunting/33076895.html
还有那个国人大哥的系统设计:一个threadpoolexecutor的queue,这个是不是问的多
线程下面的同步机制啊,比如说拿信号量或者条件变量实现生产者和消费者问题?
avatar
R*a
21
退化也是自然选择压力才退化的。
两条蛔虫,其中一条长脚长腿会满地爬,
有他长脚长腿需要的能量,别的蛔虫都繁殖好几代了,
长脚长腿的蛔虫没机会繁殖,自然就绝种了

【在 t***m 的大作中提到】
: 有没有没退化的?没有自然选择的压力要退化呀。
avatar
e*a
22
Has the big-data job market been saturated?
avatar
l*e
23
有很多半寄生的动植物,可寄生可独立,或者生长周期中一个时期独立,一个时期寄生

【在 t***m 的大作中提到】
: 有没有没退化的?没有自然选择的压力要退化呀。
avatar
a*e
24
同感,感觉lz把有些问题想得过于复杂了。

【在 h**********a 的大作中提到】
: lz,我小声提醒一下哈,那个硬币的问题,你那种解法不对滴,该用dp的。
: http://www.mitbbs.com/article_t/JobHunting/33076895.html
: 还有那个国人大哥的系统设计:一个threadpoolexecutor的queue,这个是不是问的多
: 线程下面的同步机制啊,比如说拿信号量或者条件变量实现生产者和消费者问题?

avatar
g*e
25
硬币问题的第一个没看出什么问题呀。但第二问应该是dp问题,可以转化为有weight 1
:2:1的2, 14, 10的背包问题?

[发表自未名空间手机版 - m.mitbbs.com]

【在 h**********a 的大作中提到】
: lz,我小声提醒一下哈,那个硬币的问题,你那种解法不对滴,该用dp的。
: http://www.mitbbs.com/article_t/JobHunting/33076895.html
: 还有那个国人大哥的系统设计:一个threadpoolexecutor的queue,这个是不是问的多
: 线程下面的同步机制啊,比如说拿信号量或者条件变量实现生产者和消费者问题?

avatar
a*s
26
dp的前提是:全局可以拆成可重复的局部,局部最优可以导致全局最优,其实也是
greedy algorithm的思想。
如果是5,2,1的话,个人认为是没有问题的,但是加入3.5就有问题了。不知道是不是
符合你的想法。
那个设计题,国人大哥直接跟俺说了时用wait和notifyall的,不含糊。个人觉得这位
大哥很值得俺尊敬。

【在 h**********a 的大作中提到】
: lz,我小声提醒一下哈,那个硬币的问题,你那种解法不对滴,该用dp的。
: http://www.mitbbs.com/article_t/JobHunting/33076895.html
: 还有那个国人大哥的系统设计:一个threadpoolexecutor的queue,这个是不是问的多
: 线程下面的同步机制啊,比如说拿信号量或者条件变量实现生产者和消费者问题?

avatar
a*s
27
谢谢大家回复,后来知道是culture不match,希望提醒一下大家,不同的公司风格不同
。有些公司喜欢不断深入讨论,给出不寻常解法的人,注重思维过程和火花的并发;有
些公司希望你低调一点,不知道就老实说不知道,要学会给足人家面子;有些介于两者
之间。
但是俺自己也检讨自己,可能有时候太过强势,太想跟别人探讨问题,怀疑一切(读
PHD的后遗症),导致别人感情上不舒服,也是很有可能的。毕竟不是谁都能接受别人
的频繁质疑并乐在其中的。
希望对后来人有所帮助吧。继续努力刷题了。呵呵。
avatar
e*a
28
which company do u work for now?
avatar
h*a
29
5,2,1可以,换成别的数不可以,所有说,greedy不work啊!我们写代码当然要解决一
类问题啦:).换个数字比较说明问题,假如给你1,5,15,20和25,要想得到40,哪种组
合?按照greedy就是1个25,1个15,1个5,一共就是3个硬币。但是2个20的用的更少,2
个更少。所有必须遍历所有能凑成40的组合,才能得到最优。greedy给出的解,用的硬
币肯定比较少,但不一定是最少的。
另外你说的wait和notifyall,是个函数吗,还是就是个概念啊。如果是个概念,那比
如具体到linux下(我只知道linux下),就可以用semaphore,conditional virable的
sem_wait, sem_post, pthread_cond_wait什么的啊。和国人大哥说的似乎没有矛盾?

【在 a*****s 的大作中提到】
: dp的前提是:全局可以拆成可重复的局部,局部最优可以导致全局最优,其实也是
: greedy algorithm的思想。
: 如果是5,2,1的话,个人认为是没有问题的,但是加入3.5就有问题了。不知道是不是
: 符合你的想法。
: 那个设计题,国人大哥直接跟俺说了时用wait和notifyall的,不含糊。个人觉得这位
: 大哥很值得俺尊敬。

avatar
j*3
30
楼主什么背景啊?这家给点面难不?
avatar
a*2
31
硬币的那个是不是应该用DP,
数字 x
硬币 1,2,5
int DP[x+1]
DP[0] = 0
DP[i] = x+1, for i = 1,...,x
int[] coins = new int[]{1,2,5};
for(int i = 1 ; i <= x; i++ )
for(int j = 0 ; j < 3; j++)
if(i >= coins[j])
DP[i-1] = min(DP[i-1],DP[i-coins[j]]+1);
return DP[x];
avatar
y*8
32
这强度真大。。。。
avatar
a*s
33
大哥,您要给俺offer么?

【在 e***a 的大作中提到】
: which company do u work for now?
avatar
D*g
34
无语了,什么鸟公司,
LZ答的这么好,都没offer
相关阅读
圆明园被烧,是西方反动势力的野蛮动物表现 (转载)Re: 感觉养猫比养狗逼格更高 (转载)联合航空1970年的空姐C罗被要求就扔话筒道歉:让整个国家感到尴尬 (转载)BBC:全世界都敲西瓜判断 是否成熟 不单是中国人(图) 观察者网 睿文 1小时34分钟前 近日,意大利超市禁止顾客敲西瓜的网络照片引起热议,英国广播公司(BBC)也加入了围观队伍。上海观察23日晚间报道,BBC就这种行为给出了自己的判断:不仅中国人,几乎全世界的人都会这样做。 http://i.guancha.cn/news/2016/06/24/20160624100521688.JPG 在YouTube上搜索Knock a Watermelon,有大量人们讲授怎样通过敲来挑西瓜经验的视频。这位小姑娘很得意地传授自己敲西瓜的经验 上海观察编译原文如下: 外表平淡无奇的西瓜,可谓是夏天的化身。但如何知道它已经熟透?一个方法是,重重敲打西瓜表皮,能通过声音判断它是否可以开吃。    http://i.guancha.cn/news/2016/06/24/20160624100811576.jpg 一位国外网友:我妈正在考我通过敲来挑西瓜的技能 最近,这一方法在中国互联网上引发热议。事件的缘起在遥远的意大利。该国一家超市立了一块牌子,上面写道:“尊敬的顾客,请您不要再敲西瓜了,它们是真的不会回应的。”这张日后引起争议的照片由一个自称“孤岛守护者”的博友发布。据称他是生活在米兰的中国人。 http://i.guancha.cn/news/2016/06/24/20160624101228844.jpg 这则2009年的文章认为,通过敲西瓜的回声判断西瓜是否成熟没有效果 虽然并无迹象显示告示针对中国顾客——因为牌子是用意大利语而非汉语写的,但它仍被视作针对中国人之举,因为一些中国观察人士认为通过敲拍方式挑瓜是中国人独一无二的习惯。 西瓜的话题是又一个中国人关注自己海外形象的例子。最近,中国外交部否认了有关中国食品公司用人肉制成罐头牛肉在非洲销售的报道,赞比亚小报《KACHEPA》已对此做了道歉。让中国游客备受批评的事还包括泰国一位模特斥责中国人插队、弄脏机场厕所。因此,每当有报道把中国社交媒体上的故事当作真相时,中国网民们常常致力于恢复他们的名誉。    http://i.guancha.cn/news/2016/06/24/20160624101041264.jpg 一家国外网站教你怎样判断西瓜是否熟了 根据微博的说法,在中国媒体报道称告示是直接针对中国顾客后,相关照片被广泛转发。不过一些社交媒体用户很快证实,“敲瓜术”不是中国独有的挑瓜方法,而是全世界通用的方式。 一些人说,“敲瓜术”是从父母那儿学来的。而一项快速的网络调查则显示,不只有中国社交媒体用户那样想,敲打西瓜、听沉闷的声音几乎是一个全世界的想法。有一系列的视频和帖子,教你如何挑选好瓜。这甚至出现在电影和动画片中。风靡一时的俄罗斯卡通片《兔子,等着瞧!》中,就有一集关于敲瓜的片段。 http://i.guancha.cn/news/2016/06/24/20160624100944528.jpg 《兔子,等着瞧!》截图 还有一个卡通视频提供了一种神奇的挑瓜办法,但结果不那么令人可信。中国大学生甚至发明了一款手机APP,教你如何尽量挑到理想的西瓜。 总之,在挑选水果时,并没有一个绝对的保证,要求顾客去怎么做。但为了避免引起国际外交事件的风险,我们应该对如何挑到完美的西瓜给出一些公认的方法。以下几条可供参考: 掂分量,越重的瓜越好。 按压法,手感结实而有弹性的是好瓜。 看品相,一端有黄斑的就可开吃了。 当然,如果上述方法都失败了,那你就敲敲瓜,看卖主怎么反应吧。 前期相关精彩新闻: 西瓜盖保鲜膜细菌增10倍?这锅保险膜不背! 意大利超市:不要再敲西瓜了 它们不会回应的 上千名考生重庆砸了3吨西瓜 释放情绪 台媒:乌克兰女子大腿14秒“夹爆”3个西瓜 90后小伙为了瓜农不淋雨 买下2000斤西瓜 顾客嫌西瓜不甜报警 警察买回西瓜:确实不甜 杭州超市出售方形西瓜 常温下可放半年之久 吴建民亲属:车辆鉴定报告确认他系了安全带(图) 福建晋江媳妇当菲律宾副总统 村民将敬告先祖(图) 每月3000元不够花 女大学生1周连偷7台电脑(图) 男子发现初恋已为人妻 悲伤过度驾车撞上高架桥(图)英国脱欧怎么感觉给世界带来一场金融危机英国显然是大赢家啊动物世界的故事(动物搞笑幽默)(转载)女子讲情史唤醒植物人前男友 前男友醒来就逼婚蜘蛛侠可以学习下这个你两是老邢的机器人吧战无不胜的机器狗爆笑笑话 笑死人不偿命 (转载)请推荐一款performace好的cable modem. (转载)王垠不离开美国了 (转载)劈叉欧洲议会提议把机器人当人:必须缴纳社会保险英国公投影响股市了赶脚米尤真的是宇宙大帝阿余幼时即嗜学,家贫,那就不学了
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。