Re: MapR Technologies continue hiring a lot of positions (转载)# DataSciences - 数据科学
z*e
1 楼
【 以下文字转载自 JobHunting 讨论区 】
发信人: xmj http://www.zenofon.com/QHJRE, 信区: JobHunting
标 题: Re: MapR Technologies continue hiring a lot of positions
发信站: BBS 未名空间站 (Sat Jul 19 13:19:40 2014, 美东)
俺做bigdata5年多,这三家公司都研究过,简单说说供参考。
Cloudera成立早,有很多yahoo的老人在,骗了很多钱,目前以做service为主,比较领
先的是它的management tool,对hadoop的manage比其他的package要强。背后主要的支
持者是oracle和teradata,前段时间intel投资了。目前来看比较牛。他们自己搞了
impala,我的感觉有点不伦不类的。
Hortonworks是yahoo spinoff的,技术上来说,看看hadoop早年的code大概也知道是个
什么样水平。HDFS真心还不错,Mapreduce一般般了就。里面有很多以前做pig的人,目
前的重点则是hive。目前看没什么大优势。他家后台是微软,hadoop on windows的各
种改动基本上都是他们做的,软软给了很多钱。
Mapr这个东西,楼主先不要用google capital去误导别人。Mapr的CTO以前在google
GFS team干过很久。Google computing engine 最开始的时候也只支持MapR。MapR的后
台就是google。我觉得任何大的vc投资都比狗家更有说服力。MapR走了一条别人都不一
样的路。把HDFS给用c++ 重写了,加了不少私货,比如high availablity之类的。好处
就是稳定啊高效率啊。特别是M7把hbase的一些东西直接做进file system来说。如果不
考虑兼容性和开源,软件本来就应该这样搭,而不是被yahoo那些人搭成那样。坏处就
是虽然接口看起来差不多,但是总是有这样那样的兼容性问题,大家都做软件的也可以
理解。Mapr后来也发现hive烂所以要到interactive query的市场去争一杯羹。牵头开
源搞了个drill。我和drill早起的人也接触过,impala早期的人也接触过。我不得不说
也许MapR的CTO很懂file system,但是对data processing基本上是啥都不行。招来的
人明显也不会干活,比impala差不少。现在算起来都过去一年多了,还在imcubation。
我个人对于MapR的drill并不是很看好。另外一点,这是个老印公司,file system的队
伍在印度,Hbase的应该在美国,drill的很多人都在美国。中国人里面不多,总体来说
我觉得这三个其实都一般。
我个人比较看好的有俩, 第一是vmware和EMC搞的pivtal,这公司成立的虽然晚但是来
势凶猛,产品性能很不错,有老东家的支持,我觉得至少可以和cloudera一起占据半壁
江山。Hortonworks肯定不会死,因为微软必须捧着它做hadoop on windows,MapR最不
好说,也许死的最快的是它。
另外一个公司是databricks,就是搞spark的那群人,我觉得spark一出的话,drill和
impala都会大受影响。
发信人: xmj http://www.zenofon.com/QHJRE, 信区: JobHunting
标 题: Re: MapR Technologies continue hiring a lot of positions
发信站: BBS 未名空间站 (Sat Jul 19 13:19:40 2014, 美东)
俺做bigdata5年多,这三家公司都研究过,简单说说供参考。
Cloudera成立早,有很多yahoo的老人在,骗了很多钱,目前以做service为主,比较领
先的是它的management tool,对hadoop的manage比其他的package要强。背后主要的支
持者是oracle和teradata,前段时间intel投资了。目前来看比较牛。他们自己搞了
impala,我的感觉有点不伦不类的。
Hortonworks是yahoo spinoff的,技术上来说,看看hadoop早年的code大概也知道是个
什么样水平。HDFS真心还不错,Mapreduce一般般了就。里面有很多以前做pig的人,目
前的重点则是hive。目前看没什么大优势。他家后台是微软,hadoop on windows的各
种改动基本上都是他们做的,软软给了很多钱。
Mapr这个东西,楼主先不要用google capital去误导别人。Mapr的CTO以前在google
GFS team干过很久。Google computing engine 最开始的时候也只支持MapR。MapR的后
台就是google。我觉得任何大的vc投资都比狗家更有说服力。MapR走了一条别人都不一
样的路。把HDFS给用c++ 重写了,加了不少私货,比如high availablity之类的。好处
就是稳定啊高效率啊。特别是M7把hbase的一些东西直接做进file system来说。如果不
考虑兼容性和开源,软件本来就应该这样搭,而不是被yahoo那些人搭成那样。坏处就
是虽然接口看起来差不多,但是总是有这样那样的兼容性问题,大家都做软件的也可以
理解。Mapr后来也发现hive烂所以要到interactive query的市场去争一杯羹。牵头开
源搞了个drill。我和drill早起的人也接触过,impala早期的人也接触过。我不得不说
也许MapR的CTO很懂file system,但是对data processing基本上是啥都不行。招来的
人明显也不会干活,比impala差不少。现在算起来都过去一年多了,还在imcubation。
我个人对于MapR的drill并不是很看好。另外一点,这是个老印公司,file system的队
伍在印度,Hbase的应该在美国,drill的很多人都在美国。中国人里面不多,总体来说
我觉得这三个其实都一般。
我个人比较看好的有俩, 第一是vmware和EMC搞的pivtal,这公司成立的虽然晚但是来
势凶猛,产品性能很不错,有老东家的支持,我觉得至少可以和cloudera一起占据半壁
江山。Hortonworks肯定不会死,因为微软必须捧着它做hadoop on windows,MapR最不
好说,也许死的最快的是它。
另外一个公司是databricks,就是搞spark的那群人,我觉得spark一出的话,drill和
impala都会大受影响。