avatar
大数据日报 2015年3月楼# DataSciences - 数据科学
m*r
1
大数据日报 2015-03-01
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-01/short.html
1) 【柴静《穹顶之下》可能会、应该会改写的新闻学】 by @钛媒体
关键词:应用, 柴静, 新闻
【柴静《穹顶之下》可能会、应该会改写的新闻学】她给传统新闻学提出了一个问题,
那就是调查和深度报道除了专业性要求,能否代入记者情感?改变的,或许恰是过去百
年来,我们最津津乐道的传统“新闻专业主义”中,最桎梏传统新闻学面向互联网冲击
里,最陈腐和最教条的那些部分。 [1]
[1] http://www.tmtpost.com/198613.html
2) 【包装跨集装箱的通信协议】 by @高煥堂_台灣Docker論壇
关键词:虚拟化, Docker, 容器
#Docker集装箱# 我的第3篇Docker文章:,敬请多指教。 [
1]
[1] http://www.cnblogs.com/SmartADT/articles/4307307.html
3) 【自动化运维经验谈,以及为什么Docker是革命性的】 by @larrycaiyu
关键词:虚拟化, Docker, 容器
@InfoQ 的文章 “自动化运维经验谈,以及为什么Docker是革命性的” [2] 讲解得很
不错,如果加上几张图片的话更棒了 [2]
[1] http://www.infoq.com/cn/news/2015/02/steve-mushero-automated-ops
[2] http://www.infoq.com/cn/news/2015/02/steve-mushero-automated-ops
4) 【关于蓝黑还是白金,Facebook数据科学组有话说】 by @phunter_lau
关键词:分析
关于蓝黑还是白金,Facebook数据科学组有话说 (匿名数据分析)原帖在 [1] @好东
西传送门
[1] https://www.facebook.com/notes/facebook-data-science/all-about-that-
dress/10152920170998859
长微博图:http://ww3.sinaimg.cn/large/698da9a7jw1epq0mcixdij20hc2bskds.jpg
5) 【The Architecture of a Data Visualization】 by @爱可可-爱生活
关键词:分析, 可视化
[文章]《The Architecture of a Data Visualization》 [1] Accurat Studio分享数
据可视化设计过程,很棒的文章
[1] https://medium.com/accurat-studio/the-architecture-of-a-data-
visualization-470b807799b4
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1eppx1muu4zj20jc9xynpd.jpg
--------
完整版 30条
http://bd.memect.com/archive/2015-03-01/long.html
avatar
m*r
2
大数据日报 2015-03-02
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-02/short.html
1) 【原创干货:数据挖掘方法及案例介绍(多页PPT)】 by @36大数据网
关键词:分析, 资源, 幻灯片
【原创干货:数据挖掘方法及案例介绍(多页PPT)】数据+人+工具+算法+知识+预测=
商业智能(BI)。在电信行业的应用: ❶ 如何发现电信客户的特征和分类
10103;如何预测哪些即将流失的客户 ❸ 如何评价客户的贡献价值 ❹如
何判断客户的欺诈行为特征 ❺如何发掘我的潜在客户 [1]
[1] http://www.36dsj.com/archives/23565
2) 【DataCanvas开放环境数据可视化黑客松】 by @开放数据中国
关键词:分析, 开放数据, 可视化
[预报名] #开放数据沙龙# 第一期 (3.14)将和大家一同探索开放环境数据的可视化
问题,在一天的黑客松活动里以小组形式分析并可视化现有的环境数据资源。此次活动
也是作为DataCanvas全球可视化竞赛的支持活动,希望有优秀的作品能够在此次黑客松
活动诞生。 (分享自 @活动行 ) [1]
[1] http://www.huodongxing.com/go/opendatasalon1#4239668-tsina-1-86185-7659f1d128a6531df8fc5de9a1124058
3) 【中国市场软件定义网络趋势】 by @ZDNet
关键词:SDN
【中桥国际:中国市场软件定义网络趋势】随着移动互联的飞速发展,个人终端移动设
备数量的增加是一日千里,各种社交网络是遍地开花,各种新应用是层出不穷,再加上
云计算和大数据时代的演进,IT服务的交付和消费方式在不断改变。 [1]
[1] http://net.zdnet.com.cn/network_security_zone/2015/0302/3047146.shtml
4) 【docker的大坑小洼】 by @孔令贤HW
关键词:虚拟化, Docker, 容器
《docker的大坑小洼》就喜欢看这种,有实践经验,又有理论分析的干货! [1]
[1] http://blog.daocloud.io/docker_troubleshootings/?from=timeline&isappinstalled=0
5) 【剖析Docker Swarm和Mesos】 by @DockerOne
关键词:虚拟化, Docker, Mesos, 容器
【剖析Docker Swarm和Mesos:是什么?如何结合?有什么优势?】本文来自
Mesosphere,从生产环境的需求出发,简要介绍了Docker Swarm的诞生北京,以及其与
Mesos、 Mesosphere DCOS之间的关系,同时,也阐述了Mesosphere管理大规模容器的
方式以及它和Swarm是如何结合的。 [1]
[1] http://dockerone.com/article/213
--------
完整版 43条
http://bd.memect.com/archive/2015-03-02/long.html
avatar
m*r
3
大数据日报 2015-03-03
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-03/short.html
1) 【如何挑选合适的大数据或Hadoop平台?】 by @酷勤网-程序员的那点事
关键词:计算框架, Hadoop
《如何挑选合适的大数据或Hadoop平台?》IBM、Oracle、SAP、甚至Microsoft等几乎所
有的大型软件提供商都采用了Hadoop。然而,当你已经决定要使用Hadoop来处理大数据
时,首先碰到的问题就是如何开始以及选择哪一种产品。 [1] (来自: 百度空间)
[1] http://www.kuqin.com/shuoit/20150225/344912.html
长微博图:http://ww3.sinaimg.cn/large/a1ab8e59jw1epslmfxhnfj20c85zikjl.jpg
2) 【10x系列之Clay.io的服务发现】 by @DockerOne
关键词:虚拟化, Docker, 容器
【10x系列之Clay.io的服务发现】Clay.io的Zoli Kahan撰写了“10X”系列博文,分享
如何只使用一个很小的团队支撑Clay.io的大规模应用。本文是整个系列的第四篇,介
绍如何构建一个服务发现系统。 [1]
[1] http://dockerone.com/article/215
3) 【中国实时空气污染地图】 by @全球深度报道网
关键词:分析, 可视化
【中国实时空气污染地图】这个网站可以查询中国各个城市的实时空气质量指数,并做
了地图式可视化,推荐: [1]
[1] http://aqicn.org/map/china/#@g/30.804/103.818/4z
4) 【京东大数据平台产品体系曝光:提数工具如何演变成预测平台】 by @36大数据网
关键词:应用
【京东大数据平台产品体系曝光:提数工具如何演变成预测平台】调度平台 订单交易
,仓储物流等众多京东系统都会产生数据,仅日志内容每天的大小约为1TB,大量的数
据如何统一汇总到数据仓库来呢?这就需要调度产品来实现数据生产。京东调度平台发
展至今已经是3.0版本 [1]
[1] http://www.36dsj.com/archives/23657
5) 【重磅:一个数据分析师眼中的柴静雾霾调查】 by @36大数据网
关键词:分析, 资源, 报告, 柴静
【重磅:一个数据分析师眼中的柴静雾霾调查】柴静雾霾调查演讲以演讲者女儿为线索
,用海量数据、图表、照片、纪录片资料等作为论据,用回答问题的方式和讲故事的语
气,逐层递进,证明了演讲者的论点。其中,演讲者使用的逻辑演绎和数据展现等,对
撰写数据分析报告有启示帮助。 [1]
[1] http://www.36dsj.com/wumai
--------
完整版 35条
http://bd.memect.com/archive/2015-03-03/long.html
avatar
m*r
4
大数据日报 2015-03-04
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-04/short.html
1) 【Spark Streaming容错的改进和零数据丢失】 by @CSDN云计算
关键词:计算框架, Spark
【Spark Streaming容错的改进和零数据丢失】实时流处理系统必须要能在24/7时间内
工作,因此它需要具备从各种系统故障中恢复过来的能力。最开始,Spark Streaming
就支持从driver和worker故障恢复的能力。本文将详细描述Spark Streaming容错的改
进和零数据丢失。 [1]
[1] http://www.csdn.net/article/2015-03-03/2824081
2) 【数据可视化常用的五种方式及案例分析】 by @数据挖掘与数据分析
关键词:分析, 可视化
【数据可视化常用的五种方式及案例分析】一、面积&尺寸可视化,二、颜色可视化 ,
三、图形可视化 ,四、地域空间可视化,五、概念可视化 ,详见 [1]
[1] http://mp.weixin.qq.com/s?__biz=MjM5MDI1ODUyMA==&mid=204895937&idx=2&sn=4b0cc59bf7a0b9bd8c0ac047cda13f71#rd
3) 【阿里向政府主动开放数据的三种猜想】 by @199IT-互联网数据中心
关键词:开放数据
【阿里向政府主动开放数据的三种猜想】1.数据控制权将引发财富和权力运行的新秩序
建设;2.企业向政府主动开放数据是对政府数据开放的一种召唤;3.第三方数据的开放
将推动阳光政务与深化改革的进程。截至2014年3月,阿里已攒下超过100PB已处理数据
。 [1]
[1] http://weibo.com/p/1001603816774037567795
4) 【再谈《Docker的大坑小洼》】 by @LUPA开源社区
关键词:虚拟化, Docker, 容器
【再谈《Docker的大坑小洼》】今天闲暇看了一下宏亮同学写的一篇《Docker的大坑小
洼》,非常受启发。因为Docker的文章真的很多了,但大家如果只是玩一玩,有很 ...
[1]
[1] http://www.lupaworld.com/portal.php?mod=view&aid=250908
5) 【Hadoop学习笔记—10.Shuffle过程那点事儿】 by @中国云计算论坛
关键词:计算框架, Hadoop, 笔记
【Hadoop学习笔记—10.Shuffle过程那点事儿】Hadoop的shuffle过程就是从map端输出
到reduce端输入之间的过程,这一段应该是Hadoop中最核心的部分,因为涉及到Hadoop
中最珍贵的网络资源,所以shuffle过程中会有很多可以调节的参数,也有很多策略可
以研究 [1]
[1] http://www.thebigdata.cn/Hadoop/13600.html
--------
完整版 43条
http://bd.memect.com/archive/2015-03-04/long.html
avatar
m*r
5
大数据日报 2015-03-05
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-05/short.html
1) 【成为一名数据分析师的新手指导】 by @伯乐在线官方微博
关键词:分析
《成为一名数据分析师的新手指导》本文是著名学习网站Udacity的数据分析基础性文
章。由于Udacity的就业导向,不同于单纯介绍学习路径,文章还从职业人士的角度讲
述数据分析的方方面面。文章同时附有视频,不失为一篇好的介绍文 [1] @东邪他爹 译
[1] http://blog.jobbole.com/84606/
2) 【关于Docker你应该知道的10件事】 by @LUPA开源社区
关键词:计算框架, 数据库, 虚拟化, Docker, Hadoop, MongoDB, 容器
【关于Docker你应该知道的10件事】如果你在企业IT工作,那你会听说过Docker。即使
在是像Puppet、Hadoop和MongoDB这样的热门技术中,Docker也会脱颖而出。但正是因
... [1]
[1] http://www.lupaworld.com/portal.php?mod=view&aid=250966
3) 【Hadoop学习笔记—12.MapReduce中的常见算法】 by @大数据资讯
关键词:计算框架, Hadoop, MapReduce, 笔记
【Hadoop学习笔记—12.MapReduce中的常见算法】单词计数这个是MapReduce的经典案
例,经典的不能再经典了!"数据去重"主要是为了掌握和利用并行化思想来对数据进行
有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似
庞杂的任务都会涉及数据去重 [1]
[1] http://www.thebigdata.cn/Hadoop/13619.html
4) 【为什么沃尔玛会选择OpenStack】 by @酷勤网-程序员的那点事
关键词:云服务, OpenStack
《为什么沃尔玛会选择OpenStack》沃尔玛一直通过采用先进技术推动企业发展。他们
是最早向供应商开放库存系统的企业之一。他们还是互联网出现之前第一家使用卫星通
信连接商店网络的公司。 [1] (来自: InfoQ )
[1] http://www.kuqin.com/shuoit/20150228/344978.html
长微博图:http://ww4.sinaimg.cn/large/a1ab8e59jw1epv3samffyj20c80yetf9.jpg
5) 【Spark Streaming容错的改进和零数据丢失】 by @数盟社区
关键词:计算框架, Spark
【Spark Streaming容错的改进和零数据丢失】本文来自Spark Streaming项目带头人
Tathagata Das的博客文章,他现在就职于Databricks公司。过去曾在UC Berkeley的
AMPLab实验室进行大数据和Spark Streaming的研究工作。主要谈及了Spark Streaming
容错的改进和零数据丢失。 [1]
[1] http://dataunion.org/11530.html
--------
完整版 35条
http://bd.memect.com/archive/2015-03-05/long.html
avatar
m*r
6
大数据日报 2015-03-01
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-01/short.html
1) 【柴静《穹顶之下》可能会、应该会改写的新闻学】 by @钛媒体
关键词:应用, 柴静, 新闻
【柴静《穹顶之下》可能会、应该会改写的新闻学】她给传统新闻学提出了一个问题,
那就是调查和深度报道除了专业性要求,能否代入记者情感?改变的,或许恰是过去百
年来,我们最津津乐道的传统“新闻专业主义”中,最桎梏传统新闻学面向互联网冲击
里,最陈腐和最教条的那些部分。 [1]
[1] http://www.tmtpost.com/198613.html
2) 【包装跨集装箱的通信协议】 by @高煥堂_台灣Docker論壇
关键词:虚拟化, Docker, 容器
#Docker集装箱# 我的第3篇Docker文章:,敬请多指教。 [
1]
[1] http://www.cnblogs.com/SmartADT/articles/4307307.html
3) 【自动化运维经验谈,以及为什么Docker是革命性的】 by @larrycaiyu
关键词:虚拟化, Docker, 容器
@InfoQ 的文章 “自动化运维经验谈,以及为什么Docker是革命性的” [2] 讲解得很
不错,如果加上几张图片的话更棒了 [2]
[1] http://www.infoq.com/cn/news/2015/02/steve-mushero-automated-ops
[2] http://www.infoq.com/cn/news/2015/02/steve-mushero-automated-ops
4) 【关于蓝黑还是白金,Facebook数据科学组有话说】 by @phunter_lau
关键词:分析
关于蓝黑还是白金,Facebook数据科学组有话说 (匿名数据分析)原帖在 [1] @好东
西传送门
[1] https://www.facebook.com/notes/facebook-data-science/all-about-that-
dress/10152920170998859
长微博图:http://ww3.sinaimg.cn/large/698da9a7jw1epq0mcixdij20hc2bskds.jpg
5) 【The Architecture of a Data Visualization】 by @爱可可-爱生活
关键词:分析, 可视化
[文章]《The Architecture of a Data Visualization》 [1] Accurat Studio分享数
据可视化设计过程,很棒的文章
[1] https://medium.com/accurat-studio/the-architecture-of-a-data-
visualization-470b807799b4
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1eppx1muu4zj20jc9xynpd.jpg
--------
完整版 30条
http://bd.memect.com/archive/2015-03-01/long.html
avatar
m*r
7
大数据日报 2015-03-02
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-02/short.html
1) 【原创干货:数据挖掘方法及案例介绍(多页PPT)】 by @36大数据网
关键词:分析, 资源, 幻灯片
【原创干货:数据挖掘方法及案例介绍(多页PPT)】数据+人+工具+算法+知识+预测=
商业智能(BI)。在电信行业的应用: ❶ 如何发现电信客户的特征和分类
10103;如何预测哪些即将流失的客户 ❸ 如何评价客户的贡献价值 ❹如
何判断客户的欺诈行为特征 ❺如何发掘我的潜在客户 [1]
[1] http://www.36dsj.com/archives/23565
2) 【DataCanvas开放环境数据可视化黑客松】 by @开放数据中国
关键词:分析, 开放数据, 可视化
[预报名] #开放数据沙龙# 第一期 (3.14)将和大家一同探索开放环境数据的可视化
问题,在一天的黑客松活动里以小组形式分析并可视化现有的环境数据资源。此次活动
也是作为DataCanvas全球可视化竞赛的支持活动,希望有优秀的作品能够在此次黑客松
活动诞生。 (分享自 @活动行 ) [1]
[1] http://www.huodongxing.com/go/opendatasalon1#4239668-tsina-1-86185-7659f1d128a6531df8fc5de9a1124058
3) 【中国市场软件定义网络趋势】 by @ZDNet
关键词:SDN
【中桥国际:中国市场软件定义网络趋势】随着移动互联的飞速发展,个人终端移动设
备数量的增加是一日千里,各种社交网络是遍地开花,各种新应用是层出不穷,再加上
云计算和大数据时代的演进,IT服务的交付和消费方式在不断改变。 [1]
[1] http://net.zdnet.com.cn/network_security_zone/2015/0302/3047146.shtml
4) 【docker的大坑小洼】 by @孔令贤HW
关键词:虚拟化, Docker, 容器
《docker的大坑小洼》就喜欢看这种,有实践经验,又有理论分析的干货! [1]
[1] http://blog.daocloud.io/docker_troubleshootings/?from=timeline&isappinstalled=0
5) 【剖析Docker Swarm和Mesos】 by @DockerOne
关键词:虚拟化, Docker, Mesos, 容器
【剖析Docker Swarm和Mesos:是什么?如何结合?有什么优势?】本文来自
Mesosphere,从生产环境的需求出发,简要介绍了Docker Swarm的诞生北京,以及其与
Mesos、 Mesosphere DCOS之间的关系,同时,也阐述了Mesosphere管理大规模容器的
方式以及它和Swarm是如何结合的。 [1]
[1] http://dockerone.com/article/213
--------
完整版 43条
http://bd.memect.com/archive/2015-03-02/long.html
avatar
m*r
8
大数据日报 2015-03-03
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-03/short.html
1) 【如何挑选合适的大数据或Hadoop平台?】 by @酷勤网-程序员的那点事
关键词:计算框架, Hadoop
《如何挑选合适的大数据或Hadoop平台?》IBM、Oracle、SAP、甚至Microsoft等几乎所
有的大型软件提供商都采用了Hadoop。然而,当你已经决定要使用Hadoop来处理大数据
时,首先碰到的问题就是如何开始以及选择哪一种产品。 [1] (来自: 百度空间)
[1] http://www.kuqin.com/shuoit/20150225/344912.html
长微博图:http://ww3.sinaimg.cn/large/a1ab8e59jw1epslmfxhnfj20c85zikjl.jpg
2) 【10x系列之Clay.io的服务发现】 by @DockerOne
关键词:虚拟化, Docker, 容器
【10x系列之Clay.io的服务发现】Clay.io的Zoli Kahan撰写了“10X”系列博文,分享
如何只使用一个很小的团队支撑Clay.io的大规模应用。本文是整个系列的第四篇,介
绍如何构建一个服务发现系统。 [1]
[1] http://dockerone.com/article/215
3) 【中国实时空气污染地图】 by @全球深度报道网
关键词:分析, 可视化
【中国实时空气污染地图】这个网站可以查询中国各个城市的实时空气质量指数,并做
了地图式可视化,推荐: [1]
[1] http://aqicn.org/map/china/#@g/30.804/103.818/4z
4) 【京东大数据平台产品体系曝光:提数工具如何演变成预测平台】 by @36大数据网
关键词:应用
【京东大数据平台产品体系曝光:提数工具如何演变成预测平台】调度平台 订单交易
,仓储物流等众多京东系统都会产生数据,仅日志内容每天的大小约为1TB,大量的数
据如何统一汇总到数据仓库来呢?这就需要调度产品来实现数据生产。京东调度平台发
展至今已经是3.0版本 [1]
[1] http://www.36dsj.com/archives/23657
5) 【重磅:一个数据分析师眼中的柴静雾霾调查】 by @36大数据网
关键词:分析, 资源, 报告, 柴静
【重磅:一个数据分析师眼中的柴静雾霾调查】柴静雾霾调查演讲以演讲者女儿为线索
,用海量数据、图表、照片、纪录片资料等作为论据,用回答问题的方式和讲故事的语
气,逐层递进,证明了演讲者的论点。其中,演讲者使用的逻辑演绎和数据展现等,对
撰写数据分析报告有启示帮助。 [1]
[1] http://www.36dsj.com/wumai
--------
完整版 35条
http://bd.memect.com/archive/2015-03-03/long.html
avatar
m*r
9
大数据日报 2015-03-04
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-04/short.html
1) 【Spark Streaming容错的改进和零数据丢失】 by @CSDN云计算
关键词:计算框架, Spark
【Spark Streaming容错的改进和零数据丢失】实时流处理系统必须要能在24/7时间内
工作,因此它需要具备从各种系统故障中恢复过来的能力。最开始,Spark Streaming
就支持从driver和worker故障恢复的能力。本文将详细描述Spark Streaming容错的改
进和零数据丢失。 [1]
[1] http://www.csdn.net/article/2015-03-03/2824081
2) 【数据可视化常用的五种方式及案例分析】 by @数据挖掘与数据分析
关键词:分析, 可视化
【数据可视化常用的五种方式及案例分析】一、面积&尺寸可视化,二、颜色可视化 ,
三、图形可视化 ,四、地域空间可视化,五、概念可视化 ,详见 [1]
[1] http://mp.weixin.qq.com/s?__biz=MjM5MDI1ODUyMA==&mid=204895937&idx=2&sn=4b0cc59bf7a0b9bd8c0ac047cda13f71#rd
3) 【阿里向政府主动开放数据的三种猜想】 by @199IT-互联网数据中心
关键词:开放数据
【阿里向政府主动开放数据的三种猜想】1.数据控制权将引发财富和权力运行的新秩序
建设;2.企业向政府主动开放数据是对政府数据开放的一种召唤;3.第三方数据的开放
将推动阳光政务与深化改革的进程。截至2014年3月,阿里已攒下超过100PB已处理数据
。 [1]
[1] http://weibo.com/p/1001603816774037567795
4) 【再谈《Docker的大坑小洼》】 by @LUPA开源社区
关键词:虚拟化, Docker, 容器
【再谈《Docker的大坑小洼》】今天闲暇看了一下宏亮同学写的一篇《Docker的大坑小
洼》,非常受启发。因为Docker的文章真的很多了,但大家如果只是玩一玩,有很 ...
[1]
[1] http://www.lupaworld.com/portal.php?mod=view&aid=250908
5) 【Hadoop学习笔记—10.Shuffle过程那点事儿】 by @中国云计算论坛
关键词:计算框架, Hadoop, 笔记
【Hadoop学习笔记—10.Shuffle过程那点事儿】Hadoop的shuffle过程就是从map端输出
到reduce端输入之间的过程,这一段应该是Hadoop中最核心的部分,因为涉及到Hadoop
中最珍贵的网络资源,所以shuffle过程中会有很多可以调节的参数,也有很多策略可
以研究 [1]
[1] http://www.thebigdata.cn/Hadoop/13600.html
--------
完整版 43条
http://bd.memect.com/archive/2015-03-04/long.html
avatar
m*r
10
大数据日报 2015-03-05
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-05/short.html
1) 【成为一名数据分析师的新手指导】 by @伯乐在线官方微博
关键词:分析
《成为一名数据分析师的新手指导》本文是著名学习网站Udacity的数据分析基础性文
章。由于Udacity的就业导向,不同于单纯介绍学习路径,文章还从职业人士的角度讲
述数据分析的方方面面。文章同时附有视频,不失为一篇好的介绍文 [1] @东邪他爹 译
[1] http://blog.jobbole.com/84606/
2) 【关于Docker你应该知道的10件事】 by @LUPA开源社区
关键词:计算框架, 数据库, 虚拟化, Docker, Hadoop, MongoDB, 容器
【关于Docker你应该知道的10件事】如果你在企业IT工作,那你会听说过Docker。即使
在是像Puppet、Hadoop和MongoDB这样的热门技术中,Docker也会脱颖而出。但正是因
... [1]
[1] http://www.lupaworld.com/portal.php?mod=view&aid=250966
3) 【Hadoop学习笔记—12.MapReduce中的常见算法】 by @大数据资讯
关键词:计算框架, Hadoop, MapReduce, 笔记
【Hadoop学习笔记—12.MapReduce中的常见算法】单词计数这个是MapReduce的经典案
例,经典的不能再经典了!"数据去重"主要是为了掌握和利用并行化思想来对数据进行
有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似
庞杂的任务都会涉及数据去重 [1]
[1] http://www.thebigdata.cn/Hadoop/13619.html
4) 【为什么沃尔玛会选择OpenStack】 by @酷勤网-程序员的那点事
关键词:云服务, OpenStack
《为什么沃尔玛会选择OpenStack》沃尔玛一直通过采用先进技术推动企业发展。他们
是最早向供应商开放库存系统的企业之一。他们还是互联网出现之前第一家使用卫星通
信连接商店网络的公司。 [1] (来自: InfoQ )
[1] http://www.kuqin.com/shuoit/20150228/344978.html
长微博图:http://ww4.sinaimg.cn/large/a1ab8e59jw1epv3samffyj20c80yetf9.jpg
5) 【Spark Streaming容错的改进和零数据丢失】 by @数盟社区
关键词:计算框架, Spark
【Spark Streaming容错的改进和零数据丢失】本文来自Spark Streaming项目带头人
Tathagata Das的博客文章,他现在就职于Databricks公司。过去曾在UC Berkeley的
AMPLab实验室进行大数据和Spark Streaming的研究工作。主要谈及了Spark Streaming
容错的改进和零数据丢失。 [1]
[1] http://dataunion.org/11530.html
--------
完整版 35条
http://bd.memect.com/archive/2015-03-05/long.html
avatar
m*r
11
大数据日报 2015-03-06
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-06/short.html
1) 【MySQL和MongoDB设计实例对比】 by @IT技术博客大学习
关键词:数据库, MongoDB, MySQL
【MySQL和MongoDB设计实例对比】 MySQL是关系型数据库中的明星,MongoDB是文档型
数据库中的翘楚。下面通过一个设计实例对比一下二者:假设我们正在维护一个手机产
品库,里面除了包含手机的名称,品牌等基本信息,还包含了... 详见: [1]
[1] http://blogread.cn/it/article/3772?f=wb
2) 【Docker实战:更轻松、更愉快、更高效】 by @DockerOne
关键词:虚拟化, Docker, 容器
【Docker实战:更轻松、更愉快、更高效】本文作者通过实例展示了Docker在日常开发
中的潜力,并不需要花费太多精力,就可以建立一套高效、简洁的流程,包括了项目自
动化的测试、持续集成及部署,将开发者从这些令人厌倦的体力劳动中解放出来,同时
为我们了解Docker提供了经验。 [1]
[1] http://dockerone.com/article/217
3) 【Hadoop不适合处理实时数据的原因剖析】 by @大数据资讯
关键词:分析, 计算框架, Hadoop
【Hadoop不适合处理实时数据的原因剖析】Hadoop已被公认为大数据分析领域无可争辩
的王者,它专注与批处理。这种模型对许多情形(比如:为网页建立索引)已经足够,但
还存在其他一些使用模型,它们需要来自高度动态的来源的实时信息。为了解决这个问
题,就得借助Twitter推出得Storm [1]
[1] http://www.thebigdata.cn/Hadoop/13638.html
4) 【大规模Docker集群助力微博迎接春晚峰值挑战】 by @Linux中国
关键词:虚拟化, Docker, 容器
大规模Docker集群助力微博迎接春晚峰值挑战 - 作者:i陈飞 | 羊年的春晚与往年的春
晚一样,却又不太一样。一样的是服务器君仍要应对全民“DDOS攻击”,不一样的是今
年无法通过简单的扩容抵御峰值。今年不但主信息流日常用户活跃度已经达到了去年…
[1]
[1] http://linux.cn/article-5000-weibo.html
5) 【回顾:大数据能铸成大错】 by @子夏曰
关键词:Tim Harford, 争鸣
科学的进展,是理论和实证互动的过程。大数据的出现,使得一些人过于乐观,以为数
据可以解决很多问题,甚至说出“理论的终结”之类的话。金融时报专栏作家Tim
Harford的长文提醒我们,没有理论和洞见,大数据能铸成大错: [1]
[1] http://www.ft.com/intl/cms/s/2/21a6e7d8-b479-11e3-a09a-00144feabdc0.html
--------
完整版 46条
http://bd.memect.com/archive/2015-03-06/long.html
avatar
m*r
12
大数据日报 2015-03-07
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-07/short.html
1) 【Explorable Explanations】 by @爱可可-爱生活
关键词:分析, 可视化
[文章]《The rise of explorable explanations》 [1] 什么是“explorable
explanations”?交互式解释 or 沉浸式可视化 or 直觉式教育?看看例子您就清楚了
,绝对是大势所趋,其中包括在微博里推荐过的可视化解释系列 以及另一篇很早的《
Explorable Explanations》 [2]
[1] http://www.maartenlambrechts.be/the-rise-of-explorable-explanations/
[2] http://worrydream.com/ExplorableExplanations/
2) 【Slider:在Yarn上部署Docker应用】 by @DockerOne
关键词:计算框架, 虚拟化, Docker, YARN, 容器
【Slider:在Yarn上部署Docker应用】Apache Slider是一个Yarn应用,它可以用来在
Yarn上部署并监控分布式应用。Slider可以在应用运行期随意扩展或者收缩应用。目前
它是Apache的孵化项目。 [1]
[1] http://dockerone.com/article/231
3) 【下一代互联汽车】 by @英特尔商用频道
关键词:云服务
【下一代互联汽车】据悉,沃尔沃汽车将利用私有云技术,自动提供安全行驶数据给司
机。如果汽车出现打滑,内建的传感器自动探测到险情,下一辆来到同样路段的汽车如
果配备这一系统,可从云计算平台提前收到警示。据悉,这一服务将在某些车型中率先
推出。 [1]
[1] http://weibo.com/p/1001603817415661225718
4) 【可视化: 组合R和D3.js的力量】 by @网路冷眼
关键词:分析, 可视化
【珠联璧合:组合R和D3.js的力量】 [1] 根据维基百科,非结构化数据占据了组织所
有数据的70%-80%。因为每人都像这些信息的宝藏,所以新的处理、分析和可视化工具
不停涌现。本文讲述用R处理数据,用D3 JS库可视化展示数据。转给搞大数据分析和可
视化的小伙伴. @2gua @Linux中国 @伯乐头条
[1] http://blog.ae.be/combining-the-power-of-r-and-d3-js/?hn#.VPm4VYG1b_4
5) 【Data Stories,一个讲数据可视化的播客】 by @云非鹤
关键词:分析, 应用, Enrico Bertini, Moritz Stefaner, Scott Klein, Simon
Rogers, 可视化, 新闻
推荐Data Stories,一个讲数据可视化的播客 [1] ,每期请到的嘉宾都是业界资深人
士。节目录制一小时以上,即使没时间听完、音频下给出的链接也是非常好的资源。最
近有一期请到了ProPublica的Scott Klein来讲数据新闻,之前还有一期是前卫报数据
编辑Simon Rogers。 @数据新闻网
[1] http://datastori.es/
--------
完整版 27条
http://bd.memect.com/archive/2015-03-07/long.html
avatar
m*r
13
大数据日报 2015-03-08
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-08/short.html
1) 【Docker Resources All In One】 by @爱可可-爱生活
关键词:虚拟化, Docker, 代码, 容器
[列表] Docker Resources All In One —— 堪称Docker的Awsome列表,很全面 [1]
英文版: [2]
[1] https://github.com/hangyan/docker-resources/blob/master/README_zh.md
[2] https://github.com/hangyan/docker-resources/blob/master/README_en.md
长微博图:http://ww3.sinaimg.cn/large/5396ee05jw1epyh5vktzdj20nvasd7wi.jpg
2) 【通用操作系统的终结】 by @perldaily
关键词:虚拟化
#devopsweekly#The End of the General Purpose Operating System [1] 标题很吓人
,不过其实就是列举了目前有关虚拟化、容器、init,等方面的各种项目
[1] https://speakerdeck.com/garethr/the-end-of-the-general-purpose-operating
-system
3) 【一共55个,盘点最实用的大数据可视化分析工具】 by @网路冷眼
关键词:分析, 可视化
【一共55个,盘点最实用的大数据可视化分析工具】 俗话说的好:工欲善其事,必先
利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具
通过使数据有意义的方式实现数据可视化,还有数据的可交互性...下面就来看看全球
备受欢迎的的可视化工具都有哪些吧! [1]
[1] http://www.36dsj.com/archives/24173
4) 【述说我的Hadoop成长路线】 by @36大数据网
关键词:计算框架, Hadoop
【述说我的Hadoop成长路线】 Hadoop启蒙 还在实验室时,老师就建议看google关于大
数据的三篇论文,啃了好长时间还是没完全理解。也动手搭建了Hadoop集群,运行了
wordcount,带着“Hadoop会火“的指示离开了实验室。 Hadoop入门 2011年初我加入
了一个互联网流量分析运营项… [1]
[1] http://www.36dsj.com/archives/24093
5) 【健康大数据分析技术有哪些?】 by @36大数据网
关键词:分析, 应用, 医疗
【健康大数据分析技术有哪些?】21世纪是以生命科学为主导、科学技术迅猛发展的世
纪,科技竞争力已成为决定国家前途和命运的重要因素,是推动经济发展、促进社会进
步和维护国家安全的关键所在。医学在生命科学中占有极其重要的地位,卫生科技的创
新和进步,将促进医疗… [1]
[1] http://www.36dsj.com/archives/24238
--------
完整版 22条
http://bd.memect.com/archive/2015-03-08/long.html
avatar
m*r
14
大数据日报 2015-03-09
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-09/short.html
1) 【The Spark Big Data Analytics Platform】 by @爱可可-爱生活
关键词:分析, 计算框架, 资源, PDF, Spark, 幻灯片
[幻灯]《The Spark Big Data Analytics Platform》 [1] 200+页的Spark大数据分析
讲义,内容覆盖Scala介绍、Spark数据探索、 Spark Streaming流处理、GraphX图分析
等,相当不错 云: [2]
[1] https://www.sics.se/~amir/files/download/slides/csl_workshop.pdf
[2] http://pan.baidu.com/s/1rqczG
2) 【Mesos vs OpenStack?谁才是私有云的未来?】 by @LUPA开源社区
关键词:虚拟化, 云服务, Mesos, OpenStack
【Mesos vs OpenStack?谁才是私有云的未来?】本文是Quora上的一个问题,提问者对
于私有云未来的发展趋 势感到疑惑,Mesos和OpenStack的关系是怎样的,它们之间是
否可以相互替 ... [1]
[1] http://www.lupaworld.com/portal.php?mod=view&aid=251067
3) 【专访阿里云副总裁喻思成:进军硅谷正式国际化】 by @集微网官网
关键词:云服务, IaaS, SaaS, 喻思成
【专访阿里云副总裁喻思成:进军硅谷正式国际化】阿里云负责国际业务的副总裁喻思
成表示我们实际上并不按照IAAS或者SaaS来划分云计算市场。以我们的飞天平台来说,
我们希望提供一个平台能够让客户把它小型、中型甚至非常大型的IT系统能够在云端运
行起来,这是最基本的。 [1]
[1] http://laoyaoba.com/ss6/wap/viewnews.php?itemid=539444
4) 【数据仓库DW 3.0,一个大数据通用的结构框架和模型】 by @中国统计网
关键词:商业智能
【译文:数据仓库DW 3.0,一个大数据通用的结构框架和模型】为了带来一些类似的简
单性,连贯性和完整性的大数据的辩论,我分享一个普遍信息架构和管理的进化模型。
这是对大数据到一个更通用的体系结构框架的调整和布局,架构集成了数据仓库(DW 2.
0),商业智能和统计分析。 [1]
[1] http://www.itongji.cn/article/030341932015.html
5) 【支持向量机通俗导论(理解SVM的三层境界)】 by @36大数据网
关键词:分析
【支持向量机通俗导论(理解SVM的三层境界)via: @研究者July 】大数据时代,技
术仍然为王。为了让大家更好的了解支持向量机SVM,特别从结构之法算法之道blog转
来了这篇文章。还是希望大家系统化全面的理解支持向量机SVM,它是机器学习中非常
重要的监督学习模型 [1]
[1] http://www.36dsj.com/archives/24596
--------
完整版 36条
http://bd.memect.com/archive/2015-03-09/long.html
avatar
m*r
15
大数据日报 2015-03-10
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-10/short.html
1) 【如何在Hadoop 2.0上实现深度学习?】 by @数盟社区
关键词:分析, 计算框架, Hadoop
【如何在Hadoop 2.0上实现深度学习?】本文我们就将一起探讨如何将深度学习(最前
沿的机器学习框架)部署到Hadoop的集群中。还将提供如何对算法进行修改以便适应分
布式环境。同时还将展示在标准数据集下的运行结果。 [1]
[1] http://dataunion.org/11887.html
2) 【Spark这一年,从开源到火爆】 by @CrazyJvm
关键词:计算框架, Spark, 陈超
陈超:Spark这一年,从开源到火爆-CSDN.NET [1]
[1] http://www.csdn.net/article/2015-03-10/2824162#0-tsina-1-70245-397232819ff9a47a7b7e80a40613cfe1
3) 【看开源生态系统的力量,以Docker为例】 by @InfoQ
关键词:虚拟化, Docker, 容器
【看开源生态系统的力量,以Docker为例】Opensource.com最近发布的年度十大开源项
目提醒人们:2014年对于开源而言是非常棒的一年。放眼整个IT技术栈,从存储到网络
、计算、移动和虚拟化,开源引领了最让人兴奋的创新。 [1]
[1] http://www.infoq.com/cn/news/2015/03/docker-open-source
4) 【菜鸟也能玩转大数据:Airbnb开源Presto数据库SQL工具】 by @36大数据网
关键词:分析, 数据库, 可视化
【菜鸟也能玩转大数据:Airbnb开源Presto数据库SQL工具】Airpal是Airbnb一年前就
已经开发并使用的Presto数据查询工具,通过Airpal的设计宗旨是降低数据查询门槛,
通过可视化界面等使不同部门的业务人员也能轻松写出数据查询请求,预览、分享并复
用查询任务。 [1]
[1] http://www.36dsj.com/archives/24840
5) 【构建新一代容器云计算Big Data Platform最佳实践】 by @网路冷眼
关键词:计算框架, Spark
【构建新一代容器云计算Big Data Platform最佳实践】随着云时代的到来,大数据也
吸引了越来越多多关注。而Spark做为大数据处理的佼佼者,越来越受到人们的关注。
正是由于Spark技术的出现,使得在云计算上构建超大规模的大数据平台成为了可能。
[1]
[1] http://www.csdn.net/article/2015-03-09/2824148
--------
完整版 33条
http://bd.memect.com/archive/2015-03-10/long.html
avatar
m*r
16
大数据日报 2015-03-11
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-11/short.html
1) 【用SPSS如何做数据挖掘或数据分析】 by @36大数据网
关键词:分析
用SPSS如何做数据挖掘或数据分析?【SPSS Clementine 数据挖掘入门 (1)】 [1] 【
用SPSS做数据分析?先弄懂SPSS的基础知识吧】 [2] 【产品运营数据分析——SPSS数
据分组案例】 [3] 【一天学会统计百万级数据,百度搜索词SPSS分析】 [4]
[1] http://www.36dsj.com/archives/25038
[2] http://www.36dsj.com/archives/17334
[3] http://www.36dsj.com/archives/4850
[4] http://www.36dsj.com/archives/4877
2) 【白宫来了个“首席数据官”,这位要干什么?】 by @PingWest品玩
关键词:分析
【白宫来了个“首席数据官”,这位要干什么?】美国政府任命DJ Patil出任全国第一
个首席数据科学家,期待他将大数据运用到政府工作和公共领域的建设当中去,他们希
望打造一座数字化的白宫,利用政府所掌握的大量数据来“为美国公众的利益作出安全
保障,促进创新”。 [1]
[1] http://www.pingwest.com/big-data-white-house/
3) 【百度的BigTable开源了】 by @zhpengg
关键词:数据库, 代码
RT @TreapDB 百度的BigTable实现开源了,欢迎围观,欢迎pull request,猛击github
地址: [1]
[1] https://github.com/BaiduPS/tera
4) 【Docker恶意软件分析系列之初识Docker】 by @阿里云安全
关键词:虚拟化, Docker, 容器
#鸟哥谈安全#《Docker恶意软件分析系列之初识Docker》从今天开始我们要用流行容器
Docker来分析恶意软件,本系列会有3-4篇文章左右。这只是第1篇,给大家打打基础,
先认识一下Docker。大家多捧场,才能激励 @cnbird2008 把后续的精彩文章都写出来
。[鼓掌] [1]
[1] http://blog.sina.com.cn/s/blog_e8e60bc00102vl37.html
长微博图:http://ww2.sinaimg.cn/large/e8e60bc0gw1eq1l9rvcl1j20c84zx1b1.jpg
5) 【如何在Ubuntu系统中使用Overlay文件系统】 by @DockerOne
关键词:虚拟化, Docker, 容器
【如何在Ubuntu系统中使用Overlay文件系统】本文用最简洁的语言介绍了如何在
Ubuntu系统上运行Overlay文件系统,正如作者所说:AUFS是过去时代的王者,现在新
的国王是Overlay。看来Overlay以后将是Docker存储的首选。 [1]
[1] http://dockerone.com/article/237
--------
完整版 46条
http://bd.memect.com/archive/2015-03-11/long.html
avatar
m*r
17
大数据日报 2015-03-12
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-12/short.html
1) 【Docker的典型应用场景】 by @云创存储
关键词:虚拟化, Docker, 容器
【Docker的典型应用场景】相对于VM,docker在其轻量、配置复杂度以及资源利用率方
面有着明显的优势。 随着docker技术的不断成熟,越来越多的企业开始考虑通过
docker来改进自己的IT系统。本文列举一些docker的实际应用场景,以期能够起到抛砖
引玉的作用…… [1] @专注云计算
[1] http://www.cstor.cn/textdetail_8581.html
2) 【MapR联合创始人:2015年5个大数据技术预测】 by @36大数据网
关键词:计算框架, 应用, Hadoop, John Schroeder
【MapR联合创始人John Schroeder:2015年5个大数据技术预测】❶ 数据敏捷性
成为焦点❷机构从数据湖泊转移到数据处理平台 ❸自助服务大数据成为
主流 ❹ Hadoop供应商整合:新商业模式的发展❺ 企业架构师不再炒作
大数据 [1] 更多请看MapR中国专区: [2]
[1] http://www.36dsj.com/archives/25215
[2] http://www.36dsj.com/archives/tag/mapr
3) 【专业的信息图制作思路】 by @2gua
关键词:分析, 可视化
大数据环境下,数据可视化已经成为了一门相对独立的前沿技能,整一点散点图、柱状
图已远远不够。这篇「How to Make Powerful And Beautiful Infographics」 [1] 带
你领略下专业的信息图制作思路。 @网路冷眼 @好东西传送门 @伯乐头条
[1] http://www.1stwebdesigner.com/beautiful-infographics-2/
4) 【谷歌推全新云存储服务Nearline】 by @CSDN
关键词:存储, Tom Kershaw
【谷歌推全新云存储服务Nearline:价格低速度快】谷歌周三宣布推出谷歌云存储
Nearline,每GB数据每个月的费用只需1美分,而且数据能够在三秒甚至更短的时间内
读取。谷歌一位代表称,这项服务将“变革”存储行业,Tom Kershaw同时也指出,这
项服务具有“引发行业地震”的效果。 [1]
[1] http://geek.csdn.net/news/detail/27216
5) 【Java开发人员需要注意的五大Docker误区】 by @DockerOne
关键词:虚拟化, Docker, 容器
【Java开发人员需要注意的五大Docker误区】Docker现在很火,容器技术看上不无所不
能,但这实际上是一种误解,不要被炒作出来的泡沫迷住双眼,本文抛去炒作,理性地
从Java程序员的角度,列举出Docker目前的五大误区,帮助你更好地理解Docker的优势
和问题。 [1]
[1] http://dockerone.com/article/236
--------
完整版 42条
http://bd.memect.com/archive/2015-03-12/long.html
avatar
m*r
18
大数据日报 2015-03-13
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-13/short.html
1) 【Docker收购Kitematic:一个非常棒的GUI工具】 by @DockerOne
关键词:虚拟化, Docker, 容器
【Docker收购Kitematic:一个非常棒的GUI工具】Docker在今天宣布收购 Kitematic,
Kitematic是一个Docker GUI工具,它可以在Mac上更快速、更简单的运行Docker。
Docker官方表示,Kitematic是其生态系统中成长起来的一个非常棒的项目,它让
Docker更易使用,接下来官方将支持Windows。 [1]
[1] http://dockerone.com/article/246
2) 【湖南卫是怎样使用 docker 的】 by @长明snnn
关键词:虚拟化, 资源, Docker, 代码, 幻灯片, 容器
我真的不行了。湖南卫视在云计算领域已经远远超过我所了解的绝大多数互联网公司。
[1] 连湖南卫视都开始搞开源了 [2] 毁三观啊!!!
[1] http://www.slideshare.net/cmgs1988/docker-45601303
[2] https://github.com/HunanTV
3) 【Docker:从容到集装箱设计之】 by @高煥堂_台灣Docker論壇
关键词:虚拟化, Docker, 容器
#Docker集装箱# 《 Docker:从容到集装箱设计之 》这是我今天写完的新文
章,敬请多多指教。 [1]
[1] http://www.cnblogs.com/SmartADT/articles/4335552.html
4) 【OpenStack在大数据方面的思考】 by @陈自欣
关键词:云服务, OpenStack, PDF
《OpenStack在大数据方面的思考:技术、应用、生态系统.pdf》,推荐大家来爱知客
看看 : ) [1]
[1] http://www.izhike.cn/subject/1702482453?bsh_bid=595688061
5) 【深入Docker存储驱动(PPT)】 by @DockerOne
关键词:虚拟化, 资源, Docker, 幻灯片, 容器
【深入Docker存储驱动(PPT)】DockerOne对此PPT进行了翻译,其中,作者对Docker
存储驱动进行了比较全面的介绍,作者从Docker存储驱动的历史开始讲起,从copy-on-
write机制入手,之后分别从AUFS、Device Mapper、BTRFS、Overlay、VFS几个方面进
行了具体的介绍。 [1]
[1] http://dockerone.com/article/245
--------
完整版 35条
http://bd.memect.com/archive/2015-03-13/long.html
avatar
m*r
19
大数据日报 2015-03-14
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-14/short.html
1) 【Apache Spark 1.3发布】 by @网路冷眼
关键词:分析, 计算框架, Kafka, Spark, 流计算
【Apache Spark 1.3发布】 [1] Spark 1.3引入万众期待的DataFrame API,让大数据挖
掘简单而快速。重大改进有:新的DataFrame API;Spark SQL从Alpha毕业;内置支持
Spark包;Streaming支持底层Kafka;MLlib引入新的算法。 @hashjoin @BigData大数据
@好东西传送门 @伯乐头条 @52nlp @DataMooc
[1] https://databricks.com/blog/2015/03/13/announcing-spark-1-3.html
长微博图:http://ww4.sinaimg.cn/large/663aa05ajw1eq56evdedaj20j11m9h8v.jpg
2) 【Are You Ready for Data Science?】 by @爱可可-爱生活
关键词:分析
[文章]《Are You Ready for Data Science?》 [1] 对Data Science的系统解读,比较
全面的诠释
[1] http://www.shellypalmer.com/spb/2015/3/7/are-you-ready-for-data-science
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1eq5lax3qj2j20k83ax7rw.jpg
3) 【Python数据分析入门】 by @Python开发者
关键词:分析
《Python数据分析入门》最近,Analysis with Programming加入了Planet Python。作
为该网站的首批特约博客,我这里来分享一下如何通过Python来开始数据分析。 [1]
(伯乐在线 - Den 译,欢迎加入翻译组: [2] )
[1] http://python.jobbole.com/81133/
[2] http://www.jobbole.com/groups/6/
4) 【《大数据革命》书评】 by @周江评
关键词:书籍
原创。给某杂志写的《大数据革命》英文版,2014年出版欧美的一本好书的书评初稿。
欢迎大家点评: [1]
[1] http://pan.baidu.com/s/1gdy77Wn
5) 【If State Is Hell, SOA Is Satan】 by @登州知府
关键词:云服务, SOA
周末推荐阅读:If State Is Hell, SOA Is Satan [1]
[1] http://www.bravenewgeek.com/if-state-is-hell-soa-is-satan/
--------
完整版 35条
http://bd.memect.com/archive/2015-03-14/long.html
avatar
m*r
20
大数据日报 2015-03-15
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-15/short.html
1) 【构建一个 ARM 集群,运行分布式 Docker 容器服务】 by @登州知府
关键词:数据库, 虚拟化, Docker, etcd, 容器
构建一个 ARM 集群,运行分布式 Docker 容器服务:第一部分,硬件 [1] 第二部分,
系统镜像 [2] 第三部分,分布式容器服务 [3]
[1] http://mkaczanowski.com/building-arm-cluster-part-1-collecting-wiring-and-powering-devices/
[2] http://mkaczanowski.com/building-arm-cluster-part-2-create-and-write-system-image-with-goback/
[3] http://mkaczanowski.com/building-arm-cluster-part-3-docker-fleet-etcd-distribute-containers/
2) 【Google云服务为Docker应用提供简化版Ubuntu】 by @Linux中国
关键词:虚拟化, Docker, 容器
Google云服务为Docker应用提供简化版Ubuntu - 译者:zpl1025 | Ubuntu Core为运行
容器提供了最小的轻量级Linux环境 Google为自己的云服务采用了一个简化版的
Canonical Ubuntu Linux发行版,以优化运行Docker和其他容器。 Ubuntu Core被设计
成仅… [1]
[1] http://linux.cn/article-5060-weibo.html
3) 【Seven Concurrency Models in Seven Weeks】 by @睡眼惺忪的小叶先森
关键词:计算框架, 书籍, Spark
《Seven Concurrency Models in Seven Weeks》感觉还不错啊。看到Concurrency
enables resilient, or fault-tolerant, software through independence and
fault detection.就想起了Spark里的RDD[嘻嘻] [1] [2] @skyline09_ @囧囧有神的小
杜霉女 @armsword
[1] http://download.csdn.net/detail/u011399549/8006943
[2] http://product.china-pub.com/3771014
4) 【HDFS-raid原理】 by @leekayak
关键词:计算框架, Hadoop
[1] 本期特约嘉宾 @foxmailed 撰写的HDFS-raid原理, 欢迎订阅郁白的公众号
[1] http://mp.weixin.qq.com/s?__biz=MzA4MzYxMjEwMg==&mid=203532446&idx=1&sn=ae4744d368d29bdbd3492d8fc42b6ccb#rd
5) 【基于PageRank的医疗大数据反欺诈】 by @爱可可-爱生活
关键词:计算框架, 应用, Hadoop, 代码, 医疗
[文章]《Using PageRank to Detect Anomalies and Fraud in Healthcare》基于"
personalized PageRank",用Hadoop和SociaLite进行大数据医疗欺诈检测,以真实医
疗支付数据为例 Part1: [1] Part2: [2] GitHub: [3]
[1] http://hortonworks.com/blog/using-pagerank-detect-anomalies-fraud-healthcare/
[2] http://hortonworks.com/blog/using-pagerank-to-detect-anomalies-and-fraud-in-healthcare-part2/
[3] https://github.com/ofermend/medicare-demo
长微博图:http://ww3.sinaimg.cn/large/5396ee05jw1eq604fplk3j20my51se81.jpg
--------
完整版 34条
http://bd.memect.com/archive/2015-03-15/long.html
avatar
m*r
21
大数据日报 2015-03-16
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-16/short.html
1) 【Kitematic官方文档汇总】 by @DockerOne
关键词:虚拟化, Docker, 容器
【Kitematic官方文档汇总】周末DockerOne组织翻译了Kitematic的官方文档,
Kitematic是一个 Docker GUI 工具,它可以在 Mac 上更快速、更简单的运行Docker。
接下来也将支持Windows,从Twitter了解到Kitematic的重点也会在Windows上。 [1]
[1] http://dockerone.com/article/254
2) 【有哪些优秀的 Scala 开源项目?】 by @hongjiang_wang
关键词:计算框架, Kafka, Spark, 流计算
我在 @知乎 回答了【有哪些优秀的 Scala 开源项目?】:谢邀。 1. spark 显然已经
成为了scala里最引人关注的项目。 2. kafka 可能是仅次于spark的被广泛了解的
scala开源产品。 3. akka&spray,akka 太优秀了,以至于… [1]
[1] http://zhi.hu/hOPS
3) 【强化Docker容器:禁用SUID程序】 by @DockerOne
关键词:虚拟化, Docker, 容器
【强化Docker容器:禁用SUID程序】Docker的安全问题一直是大家关心的热点,本文重
点提出启用SUID的程序所带来的安全隐患,提出了对应的解决方法,从而加强Docker的
安全保障,值得一读。 [1]
[1] http://dockerone.com/article/193
4) 【数据产品经理工作总结篇】 by @数据挖掘与数据分析
关键词:分析
【好文!】数据产品经理工作总结篇 一、如何做一个好的数据产品经理?(1.要极其
熟悉公司业务及动向;2.要了解数据分析。好的数据PD,即使不做数据PD,也应该是个
数据分析师;3. 要了解数据仓库及商务智能;4. 要精通数据产品开发流程。数据开发
+产品开发)二、心得总结篇… [1]
[1] http://mp.weixin.qq.com/s?__biz=MjM5MDI1ODUyMA==&mid=205181896&idx=3&sn=bb2d98b6d90c86552c260791bdd30faf#rd
5) 【Reddit的聚类网络化浏览】 by @爱可可-爱生活
关键词:分析, 可视化, 论文
[可视化]《redditviz - reddit interest network》 [1] Reddit的聚类网络化浏览,
论文《Navigating the massive world of reddit: Using backbone networks to map
user interests in social media》 [2] 介绍了其实现思路,值得借鉴
[1] http://rhiever.github.io/redditviz/clustered/#
[2] http://arxiv.org/abs/1312.3387
--------
完整版 39条
http://bd.memect.com/archive/2015-03-16/long.html
avatar
m*r
22
大数据日报 2015-03-17
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-17/short.html
1) 【大数据时代的数据存储,非关系型数据库MongoDBs】 by @数盟社区
关键词:数据库, MongoDB, 吴纹羽
【大数据时代的数据存储,非关系型数据库MongoDB】如果将数据库比喻成人类的话,
那么MongoDB完全可以说是神童了,年仅5岁的他单枪匹马挑战一群叔叔级别的人物,并
且按照近几年的发展速度来看,他也即将超越PgSQL成为第四名...via.吴纹羽 [1]
[1] http://dataunion.org/12404.html
2) 【深夜推文: Scaling Docker with Kubernetes】 by @王关胜
关键词:虚拟化, Docker, Kubernetes, 容器
深夜推文: Scaling Docker with Kubernetes. 好全面:包含集群资源管理,配置及服
务发现,服务定义,任务调度及服务调度和生命周期管理,负载均衡,容器监控等。至
于服务依赖管理没看明白。 RT: [1]
[1] http://www.infoq.com/articles/scaling-docker-with-kubernetes
3) 【意大利大数据应用10个案例】 by @199IT-互联网数据中心
关键词:分析, 应用, 规划, 可视化, 旅游
【意大利大数据应用10个案例】感测人类行为预测能源消费;大数据规划米兰;评价常
住居民/移民;兴趣目标导向广告宣传;个性化导航;城市社交网络幸福度分析;米兰
城市空气污染可视化;空中鸟瞰下的人类行为;基于Twitter语言的旅游分析;城市用
地分析。 [1]
[1] http://weibo.com/p/1001603821448262232783
4) 【数据挖掘中的几个Top10】 by @iB37
关键词:分析, PDF, 教育网站
数据挖掘中的几个Top10. 1)十大数据挖掘案例研究 ICDM'10 [1] 2)十大数据挖掘陷
阱(有十一个,因为从0号开始编) ELDER 09 [2] 3)十大数据挖掘算法 ICDM’06 http://weibo.com/2536116592/C1dCVA9Hw 4)十大数据挖掘研究挑战 ICDM’05 [3]
[1] http://www.worldscientific.com/doi/pdf/10.1142/S021962201240007X
[2] http://www.sas.com/resources/asset/104412_0210.pdf
[3] http://www.cs.uvm.edu/~icdm/10Problems/10Problems-05.pdf
5) 【为什么选择使用NoSQL数据库开发如此困难?】 by @云创存储
关键词:数据库, NoSQL
【为什么选择使用NoSQL数据库开发如此困难?】传统观念中NoSQL数据库非常适合某些
数据类型,如:非关系数据源。同时,NoSQL被吹捧为最适合Web应用程序的优秀平台。
然而他适合大多数数据,特别是web应用程序的数据是相关型。那么,这是否可以给你
一个坚持…… @专注云计算 [1]
[1] http://www.cstor.cn/textdetail_8597.html
--------
完整版 28条
http://bd.memect.com/archive/2015-03-17/long.html
avatar
m*r
23
大数据日报 2015-03-18
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-18/short.html
1) 【数据分析和数据科学的免费在线教程列表】 by @爱可可-爱生活
关键词:分析, 课程, 资源
[教程]数据分析和数据科学的免费在线教程列表,分类精选了26个、共计310多小时的
优秀在线视频教学资源,整理的很有条理,推荐看看 [1]
[1] https://www.mysliderule.com/learning-paths/data-analysis/learn?#88-
capstone-projects
长微博图:http://ww3.sinaimg.cn/large/5396ee05gw1eqa2m8vu5bj20l9789npd.jpg
2) 【Docker最新安全性能调整分析】 by @DockerOne
关键词:虚拟化, Docker, 容器
【Docker最新安全性能调整分析】作者通过对Docker的最新安全更新的深入分析与探索
,总结了四条有关Docker安全更新的调整建议,包括调整能力、调整SELinux的标签、
多级安全模式、调整命名空间。 [1]
[1] http://dockerone.com/article/243
3) 【The Grammar of Data Science】 by @爱可可-爱生活
关键词:分析, 可视化
[文章]《The Grammar of Data Science》 [1] 通过实际数据分析和可视化例子,比较
R(ggplot2&dplyr)和Python(Seaborn),并从Python用户的角度感慨R某些方面的简洁和
优雅,看过之后你也会心动想要试试R的;作者并非想挑起又一场论战,而是建议用合
适的工具做合适的事,真心赞同
[1] http://technology.stitchfix.com/blog/2015/03/17/grammar-of-data-science/
长微博图:http://ww4.sinaimg.cn/large/5396ee05gw1eqa25qk4lhj20s9525e81.jpg
4) 【十八款Hadoop工具帮你驯服大数据】 by @开源力量
关键词:计算框架, Hadoop
十八款Hadoop工具帮你驯服大数据 [1] 已经通过自身的蓬勃发展证明,它不仅仅是一
套用于将工作内容传播到计算机群组当中的小型堆栈--不,这与它的潜能相比简直微不
足道。这套核心的价值已经被广泛证实,目前大量项目如雨后春笋般围绕它建立起来。
……
[1] http://www.osforce.cn/group/2/thread/1267?fr=weibo&mu=140910XRNWcDHadoop
5) 【利用d3.js对QQ群大数据资料进行可视化分析】 by @36大数据网
关键词:分析, 可视化
【挖出小马哥?利用d3.js对QQ群大数据资料进行可视化分析】 作者: Anthr @X
anthrax @insight-labs .org 背景 对于前段时间流出的QQ群数据大家想必已经有所了
解了,处理后大小将近100G,多达15亿条关系数据(QQ号,群内昵称,群号,群内权限
,群内性别和年龄)和将近9000… [1]
[1] http://www.36dsj.com/archives/25819
--------
完整版 39条
http://bd.memect.com/archive/2015-03-18/long.html
avatar
m*r
24
大数据日报 2015-03-19
@好东西传送门 出品, 过刊见
http://bd.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅大数据日报
更好看的HTML版
http://bd.memect.com/archive/2015-03-19/short.html
1) 【Spark RDD API详解(一) Map和Reduce】 by @ghosert
关键词:计算框架, Spark
【Spark RDD API详解(一) Map和Reduce】 RDD是Spark中的抽象数据结构类型,任何数
据在Spark中都被表示为RDD。从编程的角度来看,RDD可以简单看成是一个数组。和普
通数组的区别是,RDD中的数据是分区存储的,这样不同分区的数据就可以分布在不同
的机器上,同时可以被并行处理... [1]
[1] https://www.zybuluo.com/jewes/note/35032
2) 【Docker in Docker】 by @DockerOne
关键词:虚拟化, Docker, 容器, 张磊
【Docker in Docker】Docker in Docker靠谱吗?有什么好的解决方案?有开源的方案
吗?它如何简化DevOps 的流程,张磊将通过快速分发、搭建开发环境、部署自动测试
环境几个场景,通过实践解读Docker in Docker如何起到作用。 [1]
[1] http://dockerone.com/article/256
3) 【Strata+Hadoop World 2015见闻】 by @CSDN
关键词:计算框架, 数据库, Hadoop
【Strata+Hadoop World 2015见闻】SHW是世界最大的大数据盛会.本文将为读者带来这
次大会的见闻以及硅谷大数据界的最新动向和发展趋势,主要包括政府与大数据、大数
据科技、大数据与商业、中国大数据市场、新型数据库等几个方面。 [1]
[1] http://www.csdn.net/article/2015-03-19/2824266
4) 【将大数据技术用于游戏系统 Hadoop支撑强大内部框架】 by @36大数据网
关键词:计算框架, 应用, Hadoop, 游戏
【《坦克世界》将大数据技术用于游戏系统 Hadoop支撑强大内部框架(译)】 36大数
据专稿,本文由36大数据翻译组黄超翻译,转载必须获得本站及译者的同意,拒绝任何
不表明译者及来源的转载! 《坦克世界》的开发商Wargaming West的产品监制和创意
总监T.J. Wagner在PAX … [1]
[1] http://www.36dsj.com/archives/25960
5) 【讨论:PaaS的前景】 by @DockerOne
关键词:虚拟化, 云服务, Docker, IaaS, PaaS, 容器
【PaaS的前景】我看目前有好多讨论PaaS的话题,想跟大家讨论下PaaS的前景。国内新
浪的SAE很早就有了PaaS的服务,但是看这几年的发展也是不尽如人意。有很多人认为
,PaaS只适合小业务,业务规模变大了还是得用IaaS,或者自己的服务器。所以PaaS真
的有前景么,真得是用户想要的么? [1]
[1] http://dockerone.com/question/130
--------
完整版 29条
http://bd.memect.com/archive/2015-03-19/long.html
avatar
j*3
25
这个怎么加阿,我都加不上
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。