Redian新闻
>
一个关于big data 系统架构的设计问题
avatar
一个关于big data 系统架构的设计问题# JobHunting - 待字闺中
s*a
1
公司准备考虑一个hadoop 的应用, 但现在已有基于SAP 的系统, 和基于 Microsoft
SQL 的系统, 一些 顾问公司提出的建议是把所有SAP和 microsoft SQL 里的data全
load 到 HAHDOOP去。 但管理SAP和Microsoft SQL的 组都不愿意这么做。我也觉得这
不是一个正确的做法。 现在有什么成熟的架构能够只在需要的时候读取 SAP和
microsoft SQL里的data, 而不是在Hadoop上再做一套数据的备份。或者说有什么data
federation layer 的设计能够让hadoop 的 application layer 自由调度存在那些里
的data
avatar
c*y
2
I don't think you can decouple data and computing in the environment you
mentioned, unless you can introduce an independent storage layer, such as
Amazon s3
Without additional storage layer, connect Hadoop to raw dat as staging, load
processed data into SAP and ms SQL as reporting portal
avatar
s*a
3
除了 Amazon S3。 还有其他类似功能的 independent storage layer吗?公司目前不
太会考虑Amazon这样的 public cloud. 请问你说的 " load
processed data into SAP and ms SQL as reporting portal" 是什么意思。 项目希
望设计report portal在 Hadoop platform上。项目背景是这样的,公司有数据存在各
种现有的系统上, 现在希望有一个大数据分析系统能够对所有这些数据进行综合分析
,但不想把现有数据都在HDFS上做一个备份。
谢谢.

load

【在 c******y 的大作中提到】
: I don't think you can decouple data and computing in the environment you
: mentioned, unless you can introduce an independent storage layer, such as
: Amazon s3
: Without additional storage layer, connect Hadoop to raw dat as staging, load
: processed data into SAP and ms SQL as reporting portal

avatar
r*8
4
这真的是有点理想了,估计只能用AWS上面的那一套才能救你了。
我们公司两年前也是这种情况,其他组都不愿意给数据,但是数据量大了RDBMS的那一
套没办法scale,
现在各个组都来找我们要数据分析结果,找他们要数据也相当配合。
不过最重要的是领导要push,要不然没办法。
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。