avatar
请教一些面试口水题# JobHunting - 待字闺中
m*u
1
大多数没用的北美猥琐男还是留美国吧
别想着海归了, 国内现在是资本主义初级阶段, 人吃人的社会。
没用的北美猥琐男只有1%可以去吃别人, 剩下的基本是被别人吃的。
都好好赚钱吧。别他娘的有什么远大理想了。
avatar
j*3
2
最近面试,遇到了一些口水题,都不晓得怎么答,大家帮忙看看。公司就不说了,签了
保密协议。
1. hadoop 本质上有什么优势,比起传统的数据库?
我答的是,可以在多台机器上存储和并行计算,效率高,不需要copy到不同的电脑上进
行,对机器的location也没要求。
面试官说,这不是本质的。。。。
2. mongodb 本质上有什么优势?和sql比。。。
我答,是key-value pair,based on document的,对structure不是固定的,不是每个
record的每个column都有value。
面试官说,不对。
面试官问:如果search一些结果,mongodb内部是如何操作的呢?比如,搜出来考试分
数等于100的所有人名字。
我说用find(condition),
面试官说: mongodb内部如何操作?
我就不知道了。。。后来他解释了一下,我没听懂,只听到个based on document。。
。这个是咋回事呢?
3. TDD本质是怎么个过程?
我答:就是写一些代码之后,测一测,看看是不是我们要的结果,然后根据得到的结果
和我们想要的结果,再develop,写代码。
答曰:TDD就是为了保证,我们写的代码,是可以test的。。。
avatar
l*n
3
都是老实人呀 ...

【在 m*****u 的大作中提到】
: 大多数没用的北美猥琐男还是留美国吧
: 别想着海归了, 国内现在是资本主义初级阶段, 人吃人的社会。
: 没用的北美猥琐男只有1%可以去吃别人, 剩下的基本是被别人吃的。
: 都好好赚钱吧。别他娘的有什么远大理想了。

avatar
l*f
4
关注
avatar
S*l
5
赚钱就是远大理想了。国内的不是也整天想着赚钱泡妞吗?

【在 m*****u 的大作中提到】
: 大多数没用的北美猥琐男还是留美国吧
: 别想着海归了, 国内现在是资本主义初级阶段, 人吃人的社会。
: 没用的北美猥琐男只有1%可以去吃别人, 剩下的基本是被别人吃的。
: 都好好赚钱吧。别他娘的有什么远大理想了。

avatar
W*y
6
m

【在 j**********3 的大作中提到】
: 最近面试,遇到了一些口水题,都不晓得怎么答,大家帮忙看看。公司就不说了,签了
: 保密协议。
: 1. hadoop 本质上有什么优势,比起传统的数据库?
: 我答的是,可以在多台机器上存储和并行计算,效率高,不需要copy到不同的电脑上进
: 行,对机器的location也没要求。
: 面试官说,这不是本质的。。。。
: 2. mongodb 本质上有什么优势?和sql比。。。
: 我答,是key-value pair,based on document的,对structure不是固定的,不是每个
: record的每个column都有value。
: 面试官说,不对。

avatar
m*u
7
你去海归版看看好伐, 很多人打算要振兴中华的!

【在 S******l 的大作中提到】
: 赚钱就是远大理想了。国内的不是也整天想着赚钱泡妞吗?
avatar
n*n
8
mark
avatar
C*g
9
所以说在这个版说这个本来就很抽象。。。
好像跑到食堂说,大家都要用餐具吃饭啊,不要用手抓!

你去海归版看看好伐, 很多人打算要振兴中华的!

【在 m*****u 的大作中提到】
: 你去海归版看看好伐, 很多人打算要振兴中华的!
avatar
m*u
11
蛋蛋好!!!

【在 C****g 的大作中提到】
: 所以说在这个版说这个本来就很抽象。。。
: 好像跑到食堂说,大家都要用餐具吃饭啊,不要用手抓!
:
: 你去海归版看看好伐, 很多人打算要振兴中华的!

avatar
z*3
12
本质是数据结构的不同
avatar
C*g
13
美眉好!!!
你回国啦

蛋蛋好!!!

【在 m*****u 的大作中提到】
: 蛋蛋好!!!
avatar
m*n
14
google了一下,下面回答对付面试,行不行?
1. hadoop 本质上有什么优势,比起传统的数据库?
大数据时代数据的特点是大量模糊数据(unstructured data)。Hadoop的优势是能对海
量模糊数据进行汇总排序比对等操作,把他们变成有意义的数据。传统的数据库擅长处
理精确数据(structured data),精确数据是指每条数据都有着准确的含义和确定的价
值,表达很明确的信息,但是无法做到短时间海量统计。
2. mongodb 本质上有什么优势?和sql比
传统有关系型数据库与NoSQL系统在数据结构上的本质区别。传统关系型数据库通常是
基于行的表格型存储,而NoSQL系统包括了列式存储(Cassandra)、key/value存储(
Memcached)、文档型存储(CouchDB)以及图结构存储(Neo4j)
mongodb的特点是非事务、schemaless、吞吐大,它们适用于 Web 2.0 应用用户广、数
据形式不固定、对事务无要求的特点。
3. TDD本质是怎么个过程?
Test-driven development (TDD) is a software development process that relies
on the repetition of a very short development cycle: first the developer
writes an (initially failing) automated test case that defines a desired
improvement or new function, then produces the minimum amount of code to
pass that test, and finally refactors the new code to acceptable standards.
avatar
m*u
15
已经回美国了啊,呵呵

【在 C****g 的大作中提到】
: 美眉好!!!
: 你回国啦
:
: 蛋蛋好!!!

avatar
z*3
16
我觉得这几个问题其实非常棘手
不是说背背就能过关的,尤其是前两个
是摸底的题
第一个给个引子,让你发挥
第二个直接问你如何造mongodb
这都是跟你比高下的架势
就是武林高手过招的起势
对方自己如果没有点底气,不敢这么问
尤其是第二个它把mongodb的实现给介绍了一遍
这厮不简单
这种题目背答案没用
还是平常学习工作中多注意积累专业知识
avatar
J*n
17
什么叫没用的北美猥琐男
你算吗?

【在 m*****u 的大作中提到】
: 大多数没用的北美猥琐男还是留美国吧
: 别想着海归了, 国内现在是资本主义初级阶段, 人吃人的社会。
: 没用的北美猥琐男只有1%可以去吃别人, 剩下的基本是被别人吃的。
: 都好好赚钱吧。别他娘的有什么远大理想了。

avatar
j*3
18
能具体说说么?
谢谢

【在 z*******3 的大作中提到】
: 本质是数据结构的不同
avatar
w*r
19
关键是我们文科WSN美国也留不下来怎么办?

【在 m*****u 的大作中提到】
: 大多数没用的北美猥琐男还是留美国吧
: 别想着海归了, 国内现在是资本主义初级阶段, 人吃人的社会。
: 没用的北美猥琐男只有1%可以去吃别人, 剩下的基本是被别人吃的。
: 都好好赚钱吧。别他娘的有什么远大理想了。

avatar
j*3
20
哦刚看到具体说说的,谢谢了!
我仔细看看再回你哈。。。

【在 z*******3 的大作中提到】
: 我觉得这几个问题其实非常棘手
: 不是说背背就能过关的,尤其是前两个
: 是摸底的题
: 第一个给个引子,让你发挥
: 第二个直接问你如何造mongodb
: 这都是跟你比高下的架势
: 就是武林高手过招的起势
: 对方自己如果没有点底气,不敢这么问
: 尤其是第二个它把mongodb的实现给介绍了一遍
: 这厮不简单

avatar
J*n
21
还有加拿大
澳大利亚

【在 w*********r 的大作中提到】
: 关键是我们文科WSN美国也留不下来怎么办?
avatar
j*3
22
终于有牛牛详细说了。
第一个hadoop那个,我在youtube上听的介绍性质的课,和wiki,说的就是我答的那个
。。。

【在 m*****n 的大作中提到】
: google了一下,下面回答对付面试,行不行?
: 1. hadoop 本质上有什么优势,比起传统的数据库?
: 大数据时代数据的特点是大量模糊数据(unstructured data)。Hadoop的优势是能对海
: 量模糊数据进行汇总排序比对等操作,把他们变成有意义的数据。传统的数据库擅长处
: 理精确数据(structured data),精确数据是指每条数据都有着准确的含义和确定的价
: 值,表达很明确的信息,但是无法做到短时间海量统计。
: 2. mongodb 本质上有什么优势?和sql比
: 传统有关系型数据库与NoSQL系统在数据结构上的本质区别。传统关系型数据库通常是
: 基于行的表格型存储,而NoSQL系统包括了列式存储(Cassandra)、key/value存储(
: Memcached)、文档型存储(CouchDB)以及图结构存储(Neo4j)

avatar
m*u
23
我当然算啊。。 有用的大概也就吴征,唐骏, 查尔斯张他们这种的

【在 J****n 的大作中提到】
: 什么叫没用的北美猥琐男
: 你算吗?

avatar
j*3
24
大牛,能详细说说么?
还是你来详细的给俺们菜鸟介绍一下吧!
谢谢了!

【在 z*******3 的大作中提到】
: 我觉得这几个问题其实非常棘手
: 不是说背背就能过关的,尤其是前两个
: 是摸底的题
: 第一个给个引子,让你发挥
: 第二个直接问你如何造mongodb
: 这都是跟你比高下的架势
: 就是武林高手过招的起势
: 对方自己如果没有点底气,不敢这么问
: 尤其是第二个它把mongodb的实现给介绍了一遍
: 这厮不简单

avatar
m*u
25
风神你算有用的

【在 w*********r 的大作中提到】
: 关键是我们文科WSN美国也留不下来怎么办?
avatar
j*3
26
我就是看了tdd的wiki才这样回答的,难道我。。。理解错了?
帮我用中文简洁明确的说一下好么?我理解的就是那个意思阿。。。

【在 m*****n 的大作中提到】
: google了一下,下面回答对付面试,行不行?
: 1. hadoop 本质上有什么优势,比起传统的数据库?
: 大数据时代数据的特点是大量模糊数据(unstructured data)。Hadoop的优势是能对海
: 量模糊数据进行汇总排序比对等操作,把他们变成有意义的数据。传统的数据库擅长处
: 理精确数据(structured data),精确数据是指每条数据都有着准确的含义和确定的价
: 值,表达很明确的信息,但是无法做到短时间海量统计。
: 2. mongodb 本质上有什么优势?和sql比
: 传统有关系型数据库与NoSQL系统在数据结构上的本质区别。传统关系型数据库通常是
: 基于行的表格型存储,而NoSQL系统包括了列式存储(Cassandra)、key/value存储(
: Memcached)、文档型存储(CouchDB)以及图结构存储(Neo4j)

avatar
J*n
27
查尔斯张是什么典故

【在 m*****u 的大作中提到】
: 我当然算啊。。 有用的大概也就吴征,唐骏, 查尔斯张他们这种的
avatar
z*3
28
ft
这真不是三言两语就能说得清楚的,只能非常泛泛地说一下
远远不够,对方深入问下去,你还是需要自己平常多看看it动态,积累一下
http://hadoop.apache.org/
hadoop现在演变成一堆产品的集合
这里面有file system,有db,有data warehouse,有business intelligence
有编程framework,还有framework的加强版,还有可视化工具,etc.
对方既然对比的是传统db,那重点显然是hdfs, hbase和cassandra这三个上
hdfs是file system,hadoop的核心之一
file system对比一般db,最大区别就是文件结构不那么一致
一般db存数据时候都经过了预处理,所以结构很清晰,有schema
而hdfs的数据则是文件,结构非常自由,没有或者有非常少的schema
这是最大的区别,然后在hdfs基础之上,有hbase这个数据库
hbase是cp系统,一般db是ac系统,区别就是cap理论,另外一个cassandra是ap系统
除了cap,hadoop还有各种分布式算法,分布式算法尤其需要解决分布式事务
要解决分布式事务,需要对付分布式锁机制,zookeeper就负责处理分布式锁机制
然后hadoop还有其他的hive之类的,这些提供了一种类似于sql的脚本查询语言
要搞hive你需要知道数据仓库的知识,比如etl,比如data integration等等
除此之外,hadoop还有bi的部分,还有text analysis的部分,慢慢会过渡到ml
这个就需要了解统计部分的知识,search engine和text analysis的各种模型
总得来说,基础是统计以及相似度理论
这还只是冰山一角,hadoop的整个eco还在不断地膨胀,一直有新的东西加进来
前面说的分布式,数据仓库,数据库本身,ml还有search engine,text analysis
随便一个都可以展开,几乎涵盖cs的各个领域,甚至可视化
光靠这里打字,还是远远不够,说不完,hadoop东西太多了

【在 j**********3 的大作中提到】
: 大牛,能详细说说么?
: 还是你来详细的给俺们菜鸟介绍一下吧!
: 谢谢了!

avatar
J*n
29
太受打击了
我正打算归呢
看来国内也不好混啊

【在 m*****u 的大作中提到】
: 我当然算啊。。 有用的大概也就吴征,唐骏, 查尔斯张他们这种的
avatar
z*3
30
你光说可以这样做,效率高,那这像是文科生说的
人家肯定不买帐,而且严格说来还是有点问题
传统db一样可以做到分布式
而且db查起来还更快,因为db的数据本身更为工整,index也多
integration做得好的话,找起来快多了,但是一般db写起来消耗资源比较多
而且db里面有大量用户定义的transaction,容灾处理机制write ahead log这些
据说这些东西占去了日常90%的工作,这样做的结果就是一般db要错,数据要丢失
不太容易,所以db中的数据都非常精准
但是代价就是写起来消耗资源就多,要经过各种处理,数据要层层包装解包装等等
而且不是说做不到分布式,而是做到比较麻烦
因为要保证节点的数据是consistent的,有大量工作要自己去实现
hdfs直接dump文件到硬盘上,然后replica,除了namenode以外,不搞transaction
也不负责灾难备份,相比之下写的时候快多了
适合web这种大量垃圾数据同时涌入时候用
读的时候,node如果fail掉的话,hdfs有checksum
所以少量的nodes挂掉,不影响系统本身的健康
chaos monkey
avatar
y*g
31
显然不好混

【在 J****n 的大作中提到】
: 太受打击了
: 我正打算归呢
: 看来国内也不好混啊

avatar
s*y
32

这个要顶。
请问现在云计算技术正在向哪些方向发展?
今后哪些data mining和machine leaning的技术会被云计算运用?

【在 z*******3 的大作中提到】
: ft
: 这真不是三言两语就能说得清楚的,只能非常泛泛地说一下
: 远远不够,对方深入问下去,你还是需要自己平常多看看it动态,积累一下
: http://hadoop.apache.org/
: hadoop现在演变成一堆产品的集合
: 这里面有file system,有db,有data warehouse,有business intelligence
: 有编程framework,还有framework的加强版,还有可视化工具,etc.
: 对方既然对比的是传统db,那重点显然是hdfs, hbase和cassandra这三个上
: hdfs是file system,hadoop的核心之一
: file system对比一般db,最大区别就是文件结构不那么一致

avatar
J*n
33
你复出了?

【在 y*******g 的大作中提到】
: 显然不好混
avatar
j*3
34
同问
avatar
y*g
35
我算我算!

【在 J****n 的大作中提到】
: 什么叫没用的北美猥琐男
: 你算吗?

avatar
z*3
36
cloud是infrastructure
paas和saas都是垃圾
paas上面私货太多,基本上如果不是资金非常紧张
一般都不用,iaas也在逐步傻瓜化,以后iaas替代paas是大势所趋
saas就完全是一个产品了,对于其他公司有意义的仅仅在于他们提供的web service接口
cloud是分布式的升级版,跟dm, ml这种ai和data的方向没有必然联系
cloud会为这些东西提供基础建设,至于用不用,那要看上面的data如何处理
对data进行归类,然后找出training data,再总结出模式
然后再搞其他的,ml是app level的事,cloud想办法傻瓜化用户操作界面
然后做好按照使用计费,这几项就好了,至于data如何处理
那这个其实严格说来跟cloud没啥必然关系,有可能说是data收集到了之后
暴露几个ws接口给cloud用户,但是这个还是跟cloud的核心无关

【在 s****y 的大作中提到】
:
: 这个要顶。
: 请问现在云计算技术正在向哪些方向发展?
: 今后哪些data mining和machine leaning的技术会被云计算运用?

avatar
m*u
37
???
sohu 创始人你不至于不知道吧?

【在 J****n 的大作中提到】
: 查尔斯张是什么典故
avatar
z*g
38
我觉得1和2都是near-linear scalability吧
avatar
J*n
39
我不知道它叫Charles。。。

【在 m*****u 的大作中提到】
: ???
: sohu 创始人你不至于不知道吧?

avatar
M*a
40
楼主肯定是big data background再找big data 的position吧,否则不会专门问这么多
这些个东西。
avatar
y*g
41
复出个毛,打酱油路过而已

【在 J****n 的大作中提到】
: 你复出了?
avatar
j*3
42
啥意思?

【在 z******g 的大作中提到】
: 我觉得1和2都是near-linear scalability吧
avatar
w*r
43
我有用个鸡巴,我无非也就是个国内下家的美国出货小弟,我回了国,连小弟都不是。
我一直认为2005年是个分水岭,2005年不管你牛不牛,回去都有些坑可以填,05年后真
正的大牛才可以回去

【在 m*****u 的大作中提到】
: 风神你算有用的
avatar
j*3
44
lz是new grad。。。
面的是new grad position。。。。
所以已跪。。。

【在 M*******a 的大作中提到】
: 楼主肯定是big data background再找big data 的position吧,否则不会专门问这么多
: 这些个东西。

avatar
T*e
45
你悟了

【在 m*****u 的大作中提到】
: 大多数没用的北美猥琐男还是留美国吧
: 别想着海归了, 国内现在是资本主义初级阶段, 人吃人的社会。
: 没用的北美猥琐男只有1%可以去吃别人, 剩下的基本是被别人吃的。
: 都好好赚钱吧。别他娘的有什么远大理想了。

avatar
M*a
46
你们学校现在都有big data课了?

【在 j**********3 的大作中提到】
: lz是new grad。。。
: 面的是new grad position。。。。
: 所以已跪。。。

avatar
M*a
47
这个其实我觉得是搂住被黑了
这个问你所谓本质有点是guess what's in my mind type of interview question.
比如hadoop和db差别有那么n条,每条都挺本质的可以说,比如是不是paralell/有没有
schema/是不是needle in the hay的查询/有没有query language/有没有ACID
transaction/有没有logical data independence/scalability/fault tolerance/
indexing等等,你不大可能把所有差别都给列举了把,又不是背政治题目,总归有遗漏
,然后面试这厮就可以说你没说到本质把,你说了123她可以说4是本质,你说了134他
说2才是本质
avatar
j*3
48
没有,lz从来没上过big data。
问lz前,面试官还说了,我知道你不会hadoop,我知道你没用过,我就问问最基本的

【在 M*******a 的大作中提到】
: 这个其实我觉得是搂住被黑了
: 这个问你所谓本质有点是guess what's in my mind type of interview question.
: 比如hadoop和db差别有那么n条,每条都挺本质的可以说,比如是不是paralell/有没有
: schema/是不是needle in the hay的查询/有没有query language/有没有ACID
: transaction/有没有logical data independence/scalability/fault tolerance/
: indexing等等,你不大可能把所有差别都给列举了把,又不是背政治题目,总归有遗漏
: ,然后面试这厮就可以说你没说到本质把,你说了123她可以说4是本质,你说了134他
: 说2才是本质

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。