Redian新闻
>
问一个初级的问题关于数据仓库的维度
avatar
问一个初级的问题关于数据仓库的维度# Database - 数据库
d*a
1
请教: 美国医治内脏静脉血栓(门静脉,脾静脉,肠细静脉血栓.特别是手术),最好的医生
和医院. 谢谢!
avatar
f*4
2
最近想换辆新车,用cash一次付清
买车的钱能算在itemlized deduction里面么?
如果我的年收入税前是100,000,买车20,000,是不是需要缴税的收入就是8万?
avatar
j*7
3
avatar
y*a
4
有也爱看的吗?我为什么这么爱看呢?也爱看的说说这个节目的好吧。
avatar
c*e
5
avatar
s*y
6
自从来到这里,享受到无边界网络的快感后几乎很少使用微信。也许是因为太想念,今
天打开了许久没有使用的微信,点开了她的朋友圈:下个月,新年后的初二,她和他就
要结婚了。再往前翻了翻朋友圈,原来他们在今年的元旦节就领了证。我苦笑,她是我
的初恋。
不知道大家有没有这种感受,初恋就如同我们工科男早些年刚啃数学一样,即使知道它
会虐我们千百遍啊,我们最终还是非常迷恋那时候的感觉。
我的初恋就是这位即将成为别人人妻的女孩,到现在我都还记得她那笑靥如花的模样,
那可爱的酒窝,以及我们抱在一起时候的呼吸。
现在都不在了。
她就要结婚了,她不再属于我了。
别人都说我们男人花心,其实这也要分人,像我这种重情重义的人虽然到现在也谈了几
个女朋友,但是始终忘不掉的是我的初恋。这应该算是重情义的吧!
好了为了避免想起她还是把微信卸载吧,打几盘游戏,抽几根烟,睡一觉明天又是一条
科研汉子。谁说我们工科男天天只会做实验,写论文的,我们谈起感情来那是一个感天
动地。
大家对于自己的初恋都有些什么难忘的故事吗?是经过了七年之痒依然在一起还是如同
我一样看着她成为人妻而在背后默默送上祝福呢?
avatar
k*z
7
如果我的OLTP表是一个宽表。里面有时间,地点,产品,产品属性,产品厂商,运营数
据等等。
现在数据是每天同步到ODS一个Staging数据库里。
如果我想把这个宽表拆成 多个维度,和最后的事实表-运营数据。
我怎么让两个表里的key同意呢?如果增加了一个维度的值的话,怎么处理呢?
说的有点笼统,但是请尽量回答。谢谢。
一般来说生产库的表不会是宽表,但是我们这个数据库本身就是给前台用的优化过的逻
辑表。所以基本我们需要的东西都有了。
avatar
k*f
8
No.
avatar
L*y
9
i like this show. i shed a lot of tears on it.
avatar
s*o
10
OLTP不是NORMALIZE了,怎么有成宽表拆多维度了,既然现在是个半拉子TABLE,
那就重新NORMALIZE,PRODUCT, ORDER, INVENTORY一维是一维,什么叫
KEY MATCH啊,你原来的宽表不都有KEY的吗。我觉得如果你现在用的TABLE就是
个DENORMALIZED的大锅饭,那这个KEY就直接到FACT TABLE里做KEY好了,没看
到你的TABLE,只能瞎猜一下
avatar
k*z
11
比如
我现在的表是
国家,省,城市,店名,年,月,日,时间,收入,费用,毛利,纯利,收银员,提成
比,提成
这个表本身是逻辑表,也就是个view, 是给前台经理通过一个User Form看的,应该是从
OLTP系统join多个表得来的,但是因为种种愿因吧。反正我没办法去拿到最原始的各个
table了。
我现在就把这个表当作我的原始数据了。 我自己来重新构建这个数据仓库,理论上来
说,我要把这个表拆成多个维度的表和一张事实表-业务表。例如:
地理纬度:geokey 国家,省,城市
店面维度:geokey, storekey, 店名
时间维度: timekey, 年,月,日
雇员维度:employeekey, titlekey, 雇员名,性别,年龄,etc
职位维度: titlekey, 职位,提成比
事实表(业务表): geokey, timekey, employeekey, 收入,收入,费用,毛利,纯利
我的问题是如何生成这些Key,然后如何维护这些Key。
生成的时候怎么保持唯一,维护的时候怎么保持唯一还有怎么增量添加。
avatar
s*o
12
懂了,你看不到人OLTP的MODEL,只是看到人用的VIEW,所以你根本不知道别人的DATA
MODEL是什么,你等于要重新NORMALIZE到自己的MODEL里,重新清理数据FITIN你的
NORMALIZED MODEL里,
数据清理干净后,再重新建DW,当然这些KEY是你自己建的,跟原来的MODEL没关系

【在 k*z 的大作中提到】
: 比如
: 我现在的表是
: 国家,省,城市,店名,年,月,日,时间,收入,费用,毛利,纯利,收银员,提成
: 比,提成
: 这个表本身是逻辑表,也就是个view, 是给前台经理通过一个User Form看的,应该是从
: OLTP系统join多个表得来的,但是因为种种愿因吧。反正我没办法去拿到最原始的各个
: table了。
: 我现在就把这个表当作我的原始数据了。 我自己来重新构建这个数据仓库,理论上来
: 说,我要把这个表拆成多个维度的表和一张事实表-业务表。例如:
: 地理纬度:geokey 国家,省,城市

avatar
k*z
13
yes,有什么教程么?怎么建这个Key?这个diagram我也能画出来,但是这个key一般都
是怎么建啊?说白了就是怎么生成?应该建什么Key我也大概知道,
理论上说:
应该是增加一个城市,geokey在地区维度上就要自增一,同理加一个雇员就要在雇员表
里自增1,但是我这个数据是从宽表里面来的,每次有新数据进来,我岂不是要都要每
一行的每个维度都要lookup一下么?
avatar
s*o
14
你等于重新给人建NORMALIZED DATA MODEL啊,怎么建你自己说了算,
不是城市一个TABLE,雇员一个TABLE吗。是的,进来一个数据你就要
LOOKUP一下,没有的再去添加。你看不到人的MODEL本来就是在COPY别人,
看不到的东西,只能自己管理了。如果VIEW里能看到EMPLOYEE_ID和CITY_ID
的话你可以直接用他们的,CITY_ID的可能很小

【在 k*z 的大作中提到】
: yes,有什么教程么?怎么建这个Key?这个diagram我也能画出来,但是这个key一般都
: 是怎么建啊?说白了就是怎么生成?应该建什么Key我也大概知道,
: 理论上说:
: 应该是增加一个城市,geokey在地区维度上就要自增一,同理加一个雇员就要在雇员表
: 里自增1,但是我这个数据是从宽表里面来的,每次有新数据进来,我岂不是要都要每
: 一行的每个维度都要lookup一下么?

avatar
k*z
15
如果我不建了,是不是用起来做report的效率就很低》还是也很快?

【在 s**********o 的大作中提到】
: 你等于重新给人建NORMALIZED DATA MODEL啊,怎么建你自己说了算,
: 不是城市一个TABLE,雇员一个TABLE吗。是的,进来一个数据你就要
: LOOKUP一下,没有的再去添加。你看不到人的MODEL本来就是在COPY别人,
: 看不到的东西,只能自己管理了。如果VIEW里能看到EMPLOYEE_ID和CITY_ID
: 的话你可以直接用他们的,CITY_ID的可能很小

avatar
s*o
16
搞不清楚别人的MODEL,你连是一对一还是一对多都不知道,很容易搞错,
而且有些数据你的VIEW不一定有的,比如PRODUCT到底有哪些洲不能卖啊,
你只看到卖到哪里去了,不能卖到哪里不知道的。比如有的EMPLOYEE一个
也没卖出去,你也不知道这个EMPLOYEE的存在,如果有REPORT让你统计,看男的卖了
多少女的卖了多少,你的VIEW里估计没有EMPLOYEE的性别,根本就做不了。
基本是瞎子摸象。

【在 k*z 的大作中提到】
: 如果我不建了,是不是用起来做report的效率就很低》还是也很快?
avatar
k*z
17
en, 看来必须想办法把IT搞定,把原始数据搞来。
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。