x*6
2 楼
有没有入门级的资料?
S*h
4 楼
之前有网友推荐这些. 我还没去仔细看过 你参考看看吧 有用的话上来吱一声
---------
发信人: dongfeiwww (人人都是艺术家), 信区: JobHunting
标 题: hadoop面试和学习总结
发信站: BBS 未名空间站 (Thu Mar 1 04:05:10 2012, 美东)
随著大数据的盛行,Hadoop也流行起来。我面过很多hadoop相关的公司,包括一线公司
(hadoop就是公司主要产品)如cloudera, hortonworks, mapr, teradata, greenplum,
二线的(使用hadoop):apple, expedia,comScore. 当然还有很多公司facebook,
twitter, baidu, 感觉这块还是机会挺多的,我就把我知道的一些给大家分享一下。
书籍和paper
: 里面内容非常好,既有高屋建瓴,又有微观把握,
比如mapreduce各个子阶段,经常问道join在里面也有代码实现,
google的三量马车,GFS, MapReduce, BigTable
入门:
知道MapReduce大致流程,map, shuffle, reduce
知道combiner, partition作用,设置compression
搭建hadoop集群,master/slave 都运行那些服务
HDFS,replica如何定位
版本0.20.2->0.20.203->0.20.205, 0.21, 0.23, 1.0
新旧API不同
进阶:
Hadoop 参数调优,cluster level: JVM, map/reduce slots, job level: reducer #,
memory, use combiner? use compression?
pig latin, Hive 简单语法
HBase, zookeeper 搭建
最新:
关注cloudera, hortonworks blog
next generation MR2框架
高可靠性, namenode: avoid single point of failure
数据流系统:streaming storm(twitter).
演练算法:
wordcount
terasort
字典同位词
翻译sql语句 select count(x) from a group by b;
【在 x*******6 的大作中提到】
: 有没有入门级的资料?
---------
发信人: dongfeiwww (人人都是艺术家), 信区: JobHunting
标 题: hadoop面试和学习总结
发信站: BBS 未名空间站 (Thu Mar 1 04:05:10 2012, 美东)
随著大数据的盛行,Hadoop也流行起来。我面过很多hadoop相关的公司,包括一线公司
(hadoop就是公司主要产品)如cloudera, hortonworks, mapr, teradata, greenplum,
二线的(使用hadoop):apple, expedia,comScore. 当然还有很多公司facebook,
twitter, baidu, 感觉这块还是机会挺多的,我就把我知道的一些给大家分享一下。
书籍和paper
比如mapreduce各个子阶段,经常问道join在里面也有代码实现,
google的三量马车,GFS, MapReduce, BigTable
入门:
知道MapReduce大致流程,map, shuffle, reduce
知道combiner, partition作用,设置compression
搭建hadoop集群,master/slave 都运行那些服务
HDFS,replica如何定位
版本0.20.2->0.20.203->0.20.205, 0.21, 0.23, 1.0
新旧API不同
进阶:
Hadoop 参数调优,cluster level: JVM, map/reduce slots, job level: reducer #,
memory, use combiner? use compression?
pig latin, Hive 简单语法
HBase, zookeeper 搭建
最新:
关注cloudera, hortonworks blog
next generation MR2框架
高可靠性, namenode: avoid single point of failure
数据流系统:streaming storm(twitter).
演练算法:
wordcount
terasort
字典同位词
翻译sql语句 select count(x) from a group by b;
【在 x*******6 的大作中提到】
: 有没有入门级的资料?
S*h
5 楼
http://developer.yahoo.com/hadoop/tutorial/index.html
This tutorial is a little dated. But it is still very much relevant. Most
idea in Hadoop does not change much.
Once you get that fixed, you can try the Definitive Guide. If you want to
test-drive, remember to use the local-mode, don't jump to the full
distributed mode directly.
【在 x*******6 的大作中提到】
: 有没有入门级的资料?
This tutorial is a little dated. But it is still very much relevant. Most
idea in Hadoop does not change much.
Once you get that fixed, you can try the Definitive Guide. If you want to
test-drive, remember to use the local-mode, don't jump to the full
distributed mode directly.
【在 x*******6 的大作中提到】
: 有没有入门级的资料?
l*z
6 楼
谢谢,我正在看这本书,内容很好!
另外,我还同时在看另外一本书《Agile Data Science Building Data Analytics
Applications with Hadoop》,偏实用。
【在 S*******h 的大作中提到】
: 之前有网友推荐这些. 我还没去仔细看过 你参考看看吧 有用的话上来吱一声
: ---------
: 发信人: dongfeiwww (人人都是艺术家), 信区: JobHunting
: 标 题: hadoop面试和学习总结
: 发信站: BBS 未名空间站 (Thu Mar 1 04:05:10 2012, 美东)
: 随著大数据的盛行,Hadoop也流行起来。我面过很多hadoop相关的公司,包括一线公司
: (hadoop就是公司主要产品)如cloudera, hortonworks, mapr, teradata, greenplum,
: 二线的(使用hadoop):apple, expedia,comScore. 当然还有很多公司facebook,
: twitter, baidu, 感觉这块还是机会挺多的,我就把我知道的一些给大家分享一下。
: 书籍和paper
另外,我还同时在看另外一本书《Agile Data Science Building Data Analytics
Applications with Hadoop》,偏实用。
【在 S*******h 的大作中提到】
: 之前有网友推荐这些. 我还没去仔细看过 你参考看看吧 有用的话上来吱一声
: ---------
: 发信人: dongfeiwww (人人都是艺术家), 信区: JobHunting
: 标 题: hadoop面试和学习总结
: 发信站: BBS 未名空间站 (Thu Mar 1 04:05:10 2012, 美东)
: 随著大数据的盛行,Hadoop也流行起来。我面过很多hadoop相关的公司,包括一线公司
: (hadoop就是公司主要产品)如cloudera, hortonworks, mapr, teradata, greenplum,
: 二线的(使用hadoop):apple, expedia,comScore. 当然还有很多公司facebook,
: twitter, baidu, 感觉这块还是机会挺多的,我就把我知道的一些给大家分享一下。
: 书籍和paper
相关阅读
need more free books.kaffe javacJAVA TELNET 支持简繁中文及拼音输入 V1.0 Beta2jar 的问题, 路径有问题? 大家帮忙看看是啥毛病?Re: Old question:make exec of javaRe: Can I use JSP on server and use Applet as user interface on clientJAVA中文TELNET MwTerm 1.000 FinalJava Telnet Client Implementation v0.99BetaRe: 恳请各位JAVA大师:有没有这样一个东西?9% of CIO's have adopted EJB as a development platformStrongly recommend EclipseHow to compile a Java program with import my own package in UNIX由一个Java Bug谈起Re: Is there a free IDE with code autocompletion?JBUILDER 5 NEW FEATURESa question with BlueJCore Java2 Notes (5)JAVA TELNET 支持简繁中文及拼音输入 V1.0 Beta3Re: How can I get localhost's address in a Applet?重锤痛击 Robocode!