人气 8551

[资料下载] 《数据仓库工具箱》第3版 维度建模新手入门大数据应用与... [复制链接]

yuano8o8 2021-7-8 08:34:01
《数据仓库工具箱》第3版 维度建模新手入门大数据应用与技术书
《数据仓库工具箱》第3版.jpg

主编推荐
◆ 实用设计技术——有关维度和事实表的基本和**技术
◆ 14个案例研究,涉及零售业、电子商务、客户关系管理、采购、库存、订单管理、会计、人力资源、金融服务、医疗卫生、保险、教育、电信和运输等。
◆ 为12个案例研究提供了数据仓库总线矩阵示例
◆ 需要避免的维度建模陷阱和错误
◆ 增强的缓慢变化维度(SCD)技术类型0~类型7
◆ 用于处理参差不齐的可变深度层次和多值属性的桥接表
◆ 大数据分析的X佳实践
◆ 与业务参与方合作、交互设计会议的指南
◆ 有关Kimball DW/BI项目生命周期方法论的概论
◆ 对ETL系统和设计思考的总结
◆ 构建维度和事实表的34个ETL子系统和技术

目录
第1章 数据仓库、商业智能及维度建模初步 1
1.1 数据获取与数据分析的区别 1
1.2 数据仓库与商业智能的目标 2
1.3 维度建模简介 5
1.3.1 星型模式与OLAP多维数据库 6
1.3.2 用于度量的事实表 7
1.3.3 用于描述环境的维度表 9
1.3.4 星型模式中维度与事实的连接 11
1.4 Kimball的DW/BI架构 14
1.4.1 操作型源系统 14
1.4.2 获取—转换—加载(ETL)系统 14
1.4.3 用于支持商业智能决策的展现区 16
1.4.4 商业智能应用 17
1.4.5 以餐厅为例描述Kimball架构 17
1.5 其他DW/BI架构 19
1.5.1 独立数据集市架构 19
1.5.2 辐射状企业信息工厂Inmon架构 20
1.5.3 混合辐射状架构与Kimball架构 22
1.6 维度建模神话 22
1.6.1 神话1:维度模型仅包含汇总数据 23
1.6.2 神话2:维度模型是部门级而不是企业级的 23
1.6.3 神话3:维度模型是不可扩展的 23
1.6.4 神话4:维度模型仅用于预测 23
1.6.5 神话5:维度模型不能被集成 24
1.7 考虑使用维度模型的更多理由 24
1.8 本章小结 25
第2章 Kimball维度建模技术概述 27
2.1 基本概念 27
2.1.1 收集业务需求与数据实现 27
2.1.2 协作维度建模研讨 27
2.1.34步骤维度设计过程 28
2.1.4 业务过程 28
2.1.5 粒度 28
2.1.6 描述环境的维度 28
2.1.7 用于度量的事实 29
2.1.8 星型模式与OLAP多维数据库 29
2.1.9 方便地扩展到维度模型 29
2.2 事实表技术基础 29
2.2.1 事实表结构 29
2.2.2 可加、半可加、不可加事实 29
2.2.3 事实表中的空值 30
2.2.4 一致性事实 30
2.2.5 事务事实表 30
2.2.6 周期快照事实表 30
2.2.7 累积快照事实表 30
2.2.8 无事实的事实表 31
2.2.9 聚集事实表或OLAP多维数据库 31
2.2.10 合并事实表 31
2.3 维度表技术基础 31
2.3.1 维度表结构 31
2.3.2 维度代理键 32
2.3.3 自然键、持久键和超自然键 32
2.3.4 下钻 32
2.3.5 退化维度 32
2.3.6 非规范化扁平维度 32
2.3.7 多层次维度 32
2.3.8 文档属性的标识与指示器 33
2.3.9 维度表中的空值属性 33
2.3.10 日历日期维度 33
2.3.11 扮演角色的维度 33
2.3.12 杂项维度 33
2.3.13 雪花维度 33
2.3.14 支架维度 34
2.4 使用一致性维度集成 34
2.4.1 一致性维度 34
2.4.2 缩减维度 34
2.4.3 跨表钻取 34
2.4.4 价值链 34
2.4.5 企业数据仓库总线架构 35
2.4.6 企业数据仓库总线矩阵 35
2.4.7 总线矩阵实现细节 35
2.4.8 机会/利益相关方矩阵 35
2.5 处理缓慢变化维度属性 35
2.5.1 类型0:原样保留 35
2.5.2 类型1:重写 35
2.5.3 类型2:增加新行 36
2.5.4 类型3:增加新属性 36
2.5.5 类型4:增加微型维度 36
2.5.6 类型5:增加微型维度及类型1支架 36
2.5.7 类型6:增加类型1属性到类型2维度 36
2.5.8 类型7:双类型1和类型2维度 36
2.6 处理维度层次关系 37
2.6.1 固定深度位置的层次 37
2.6.2 轻微参差不齐/可变深度层次 37
2.6.3 具有层次桥接表的参差不齐/可变深度层次 37
2.6.4 具有路径字符属性的可变深度层次 37
2.7 **事实表技术 37
2.7.1 事实表代理键 37
2.7.2 蜈蚣事实表 38
2.7.3 属性或事实的数字值 38
2.7.4 日志/持续时间事实 38
2.7.5 头/行事实表 38
2.7.6 分配的事实 38
2.7.7 利用分配建立利润与损失事实表 38
2.7.8 多种货币事实 39
2.7.9 多种度量事实单位 39
2.7.10 年—日事实 39
2.7.11 多遍SQL以避免事实表间的连接 39
2.7.12 针对事实表的时间跟踪 39
2.7.13 迟到的事实 40
2.8 **维度技术 40
2.8.1 维度表连接 40
2.8.2 多值维度与桥接表 40
2.8.3 随时间变化的多值桥接表 40
2.8.4 标签的时间序列行为 40
2.8.5 行为研究分组 40
2.8.6 聚集事实作为维度属性 41
2.8.7 动态值范围 41
2.8.8 文本注释维度 41
2.8.9 多时区 41
2.8.10 度量类型维度 41
2.8.11 步骤维度 41
2.8.12 热交换维度 42
2.8.13 抽象通用维度 42
2.8.14 审计维度 42
2.8.15 X后产生的维度 42
2.9 特殊目的模式 42
2.9.1 异构产品的超类与子类模式 43
2.9.2 实时事实表 43
2.9.3 错误事件模式 43
第3章 零售业务 45
3.1 维度模型设计的4步过程 46
3.1.1 第1步:选择业务过程 46
3.1.2 第2步:声明粒度 46
3.1.3 第3步:确定维度 47
3.1.4 第4步:确定事实 47
3.2 零售业务案例研究 47
3.2.1 第1步:选择业务过程 49
3.2.2 第2步:声明粒度 49
3.2.3 第3步:确定维度 50
3.2.4 第4步:确定事实 50
3.3 维度表设计细节 53
3.3.1 日期维度 53
3.3.2 产品维度 56
3.3.3 商店维度 59
3.3.4 促销维度 60
3.3.5 其他零售业维度 62
3.3.6 事务号码的退化维度 63
3.4 实际的销售模式 63
3.5 零售模式的扩展能力 64
3.6 无事实的事实表 65
3.7 维度与事实表键 66
3.7.1 维度表代理键 66
3.7.2 维度中自然和持久的超自然键 68
3.7.3 退化维度的代理键 68
3.7.4 日期维度的智能键 68
3.7.5 事实表的代理键&n
......

精彩内容
    使用事实表代理键作为父/子模式中的父节点。一个事实表包含的行是另外粒度更细的事实表的父指针。父表中的事实表代理键也会暴露在子表中。使用事实表代理键而不使用自然父键与在维度表中使用代理键一样都存在争议。自然键是混乱且无法预测的,然而代理键是明确的整数并由ETL系统分配,而不是由源系统分配。当然,除了包括父事实表的代理键外,低粒度事实表包括父节点的维度外键,因此子事实表也包括父维度的外键,因此子事实不必遍历父事实表的代理键就可以被分片或分块。我们将在第4章中讨论,您不应当直接将事实表与其他事实表连接。
    3.8 抵制规范化的冲动
    本节将直接面对几个诱使具有规范化建模背景的建模者采用规范化建模的自然冲动。我们一直在有意识地打破传统建模规则,因为我们主要关注体现易用性和性能的价值,而不是关注事务处理的效率。
    3.8.1 具有规范化维度的雪花模式
    带有重复文本的扁平非规范化维度表使来自操作型世界的数据建模者非常不舒服。让我们回到案例研究的产品维度表。300000个产品上卷到50个不同的部门。不是冗余地存储20个字节的部门描述在产品维度表中,具有规范化阅历的建模者希望存储2字节部门代码,并为部门编码建立新的部门维度。事实上,如果原始设计中的所有描述符都被规范地放入不同的维度中,他们会感到更满
......

内容简介
随着The Data Warehouse Toolkit(1996)第1版的出版发行,Ralph Kimball为整个行业引入了维度建模技术。从此,维度建模成为一种被广泛接受的表达数据仓库和商业智能(DW/BI)系统中数据的方法。该经典书籍被认为是维度建模技术、模式和X佳实践的权威资源。
这本《数据仓库工具箱(第3版)——维度建模权威指南》汇集了到目前为止X全面的维度建模技术。本书采用新的思路和X佳实践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的专业人员。
本书涉及的所有技术都基于作者实际从事DW/BI的设计经验,通过实际案例加以描述。

作者简介
Ralph Kimball博士自1982年以来,一直是数据仓库和商业智能行业的思想开拓者。自1996年以来,The Data Warehouse Toolkit系列书籍一直是X受读者欢迎的畅销书。
Margy Ross是Kimball集团总裁,她与Ralph Kimball合作撰写了5本工具箱系列书籍。她关注数据仓库和商业智能已有30多年的历史。


下载地址
链接: https://pan.baidu.com/s/1-HmAy8A2LMugjGv9qL7InQ
提取码:
游客,如果您要查看本帖隐藏内容请回复

shl662950 2021-7-8 17:08:23
谢谢分享
回复

使用道具 举报

dw996 2021-7-18 22:59:52
thx fr sharing
回复

使用道具 举报

xuegao 2021-7-30 10:55:34
谢谢分享
回复

使用道具 举报

ericchen 2021-7-30 14:12:35
谢谢分享
回复

使用道具 举报

q531062 2021-10-11 23:10:39
谢谢分享
回复

使用道具 举报

yz4066 2021-12-8 22:26:56
谢谢分享
学习读书,军事科技
回复

使用道具 举报

panzi001 2022-2-21 13:50:24
厉害了!!
回复

使用道具 举报

lds20070101 2022-2-21 14:22:35
感谢分享
回复

使用道具 举报

问道六卫 2023-7-25 07:09:48
谢谢分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

QQ|手机版|精益人 ( 沪ICP备19004111号-1 )

GMT+8, 2024-4-27 10:41 , Processed in 0.224790 second(s), 21 queries .

Powered by Lean.ren X3.4 Licensed  © 2001-2030 LEAN.REN