Redian新闻
>
请问Hadoop要怎么学?
avatar
请问Hadoop要怎么学?# Java - 爪哇娇娃
d*n
1
我有一条紫水晶手链断了, 我用鱼线穿了一次,可是没有带多久又断了。有经验的mm
能否告诉我,该用什么线穿呢?
谢谢!
avatar
x*6
2
有没有入门级的资料?
avatar
C*x
3
鱼线这么脆弱?

mm

【在 d***n 的大作中提到】
: 我有一条紫水晶手链断了, 我用鱼线穿了一次,可是没有带多久又断了。有经验的mm
: 能否告诉我,该用什么线穿呢?
: 谢谢!

avatar
S*h
4
之前有网友推荐这些. 我还没去仔细看过 你参考看看吧 有用的话上来吱一声
---------
发信人: dongfeiwww (人人都是艺术家), 信区: JobHunting
标 题: hadoop面试和学习总结
发信站: BBS 未名空间站 (Thu Mar 1 04:05:10 2012, 美东)
随著大数据的盛行,Hadoop也流行起来。我面过很多hadoop相关的公司,包括一线公司
(hadoop就是公司主要产品)如cloudera, hortonworks, mapr, teradata, greenplum,
二线的(使用hadoop):apple, expedia,comScore. 当然还有很多公司facebook,
twitter, baidu, 感觉这块还是机会挺多的,我就把我知道的一些给大家分享一下。
书籍和paper
: 里面内容非常好,既有高屋建瓴,又有微观把握,
比如mapreduce各个子阶段,经常问道join在里面也有代码实现,
google的三量马车,GFS, MapReduce, BigTable
入门:
知道MapReduce大致流程,map, shuffle, reduce
知道combiner, partition作用,设置compression
搭建hadoop集群,master/slave 都运行那些服务
HDFS,replica如何定位
版本0.20.2->0.20.203->0.20.205, 0.21, 0.23, 1.0
新旧API不同
进阶:
Hadoop 参数调优,cluster level: JVM, map/reduce slots, job level: reducer #,
memory, use combiner? use compression?
pig latin, Hive 简单语法
HBase, zookeeper 搭建
最新:
关注cloudera, hortonworks blog
next generation MR2框架
高可靠性, namenode: avoid single point of failure
数据流系统:streaming storm(twitter).
演练算法:
wordcount
terasort
字典同位词
翻译sql语句 select count(x) from a group by b;

【在 x*******6 的大作中提到】
: 有没有入门级的资料?
avatar
S*h
5
http://developer.yahoo.com/hadoop/tutorial/index.html
This tutorial is a little dated. But it is still very much relevant. Most
idea in Hadoop does not change much.
Once you get that fixed, you can try the Definitive Guide. If you want to
test-drive, remember to use the local-mode, don't jump to the full
distributed mode directly.

【在 x*******6 的大作中提到】
: 有没有入门级的资料?
avatar
l*z
6
谢谢,我正在看这本书,内容很好!
另外,我还同时在看另外一本书《Agile Data Science Building Data Analytics
Applications with Hadoop》,偏实用。

【在 S*******h 的大作中提到】
: 之前有网友推荐这些. 我还没去仔细看过 你参考看看吧 有用的话上来吱一声
: ---------
: 发信人: dongfeiwww (人人都是艺术家), 信区: JobHunting
: 标 题: hadoop面试和学习总结
: 发信站: BBS 未名空间站 (Thu Mar 1 04:05:10 2012, 美东)
: 随著大数据的盛行,Hadoop也流行起来。我面过很多hadoop相关的公司,包括一线公司
: (hadoop就是公司主要产品)如cloudera, hortonworks, mapr, teradata, greenplum,
: 二线的(使用hadoop):apple, expedia,comScore. 当然还有很多公司facebook,
: twitter, baidu, 感觉这块还是机会挺多的,我就把我知道的一些给大家分享一下。
: 书籍和paper

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。