app开发者平台在数字化时代的重要性与发展趋势解析
674
2022-11-20
数据仓库与联机分析处理
数据仓库与联机分析处理:
数据仓库:
•数据仓库公认的(基于W. H. Inmon)定义:
–数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理过程的决策过程。
•四个基本特征:
数据是面向主题的:要做什么?数据是集成的:收集、整合多源异构数据数据是非易失的:数据的初始化操作和数据访问数据是随时间不断变化的:数据随时间变化而定期更新。
数据仓库与数据库的区别:
1) 数据库用于事务处理:
•数据库作为数据资源用于管理业务中的事务处理。
•数据库中存放的数据基本上是保存当前数据,随着业务的变化随时在更新数据库中的数据。
•不同的管理业务需要建立不同的数据库。例如,银行中储蓄业务、信用卡业务分别要建立储蓄数据库和信用卡数据库。
2) 数据仓库用于决策分析:
•数据仓库用于决策分析
•数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据
•数据仓库的数据是大量数据库的集成
•对数据库的操作比较明确,操作数据量少。对数据仓库操作不明确,操作数据量大
数据组织的四个级别:
•DW中的数据以四个基本特征为基础, 分为四个级别:早期细节级、当前细节级、轻度综合级、高度综合级。
–源数据经过综合后,首先进入当前细节级,并根据具体需要进行进一步的综合从而进入轻度综合级及至高度综合级。
–老化的数据将进入早期细节级。
–不同的综合级别称之为 "粒度"。
如图:
数据仓库设计:
数据集市类型:独立数据集市,从属数据集市.
独立数据集市:数据来自于操作型数据库,是为了满足特殊用户而建立的一种分析型环境。
从属数据集市:数据来自于企业的数据仓库。
数据仓库的数据模型:
星型模型雪花模型星座模型
都是图:
1,
星型模型:
雪花模型:
星网(星座)模型:
又一波截图:
1、星型模型(Star Model ):
雪花模型:
星座模型(Constellation Model):
联机分析处理:
OLAP的基本操作:
Ø数据切片:多维数据是由多个维度组成的,如果在某个维度上选定一个取值,则多维数据从n维下降成n-1维
Ø数据切块:将完整的数据立方体切取一部分数据而得到的新的数据立方体。
Ø数据钻取(下钻):从较高的维度层次下降到较低的维度层次上来观察多维数据
Ø数据聚合(上卷):对数据进行高层次综合的操作
Ø数据旋转:改变维度的位置关系,使最终用户可从其他视角来观察多维数据。
例子:
•切片: 在给定的数据立方体上的一个维进行选择操作, 得到一个子立方体。
钻取:
转轴(pivot or rotate)旋转:
•通过旋转可以得到不同视角的数据。旋转操作相当于平面数据将坐标轴旋转。例如,旋转可能包含了交换行和列,或是把某一个行维移到列维中去。
•或是把页面显示中的一个维和页面外的维进行交换(令其成为新的行或列中的一个)
【季度和年份变换】
案例【一堆截图】:
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~