你的位置:ag百家乐直播 > Ag百家乐时间差 > 百家乐ag真人曝光 读DAMA数据料理学问体系指南34数据仓库和商务智能主张

百家乐ag真人曝光 读DAMA数据料理学问体系指南34数据仓库和商务智能主张

发布日期:2024-12-31 04:43    点击次数:197

1. 业务驱上路分

1.1. 主要驱能源是运营撑合手职能、合规需乞降商务智能行为

1.2. 用数据来解释他们是合规的,因为数据仓库中包含历史数据,是以往往被用来反应这类条款

1.3. 商务智能撑合手一直是树立数据仓库的主要原因

2. 策动

2.1. 撑合手商务智能行为

2.2. 赋能生意分析和高效决策

2.3. 基于数据瞻念察寻找更动步履

3. 引导原则

3.1. 聚焦业务策动

3.1.1. 确保数据仓库用于组织最优先级的业务并处理业务问题

3.2. 以终为始

3.2.1. 让业务优先级和最终录用的数据鸿沟驱动数据仓库现实的创建

3.3. 全局性的想考和瞎想,局部性的行动和树立

3.3.1. 让最终的愿景引导体系架构,通过连合技俩快速迭代构建增量录用,从而齐全更获胜的投资报酬

3.4. 牵挂并合手续优化,而不是一驱动就这么作念

3.4.1. 以原始数据为基础,通过汇总额团员来欢娱需求并确保性能,但不替换细节数据

3.5. 进步透明度和自助干事

3.5.1. 高下文(多样元数据)信息越丰富,数据破钞者越能从数据中赢得更多数据价值

3.5.2. 向利益相关方公开集成的数据偏激进程信息

3.6. 与数据仓库一齐树立元数据

3.6.1. 数据仓库告捷的要害是大略准确解释数据

3.7. 协同

3.7.1. 与其他数据行为妥洽,尤其是数据治理、数据质地和元数据料理行为

3.8. 不要千人一面

3.8.1. 为每种数据破钞者提供正确的用具和居品

4. 商务智能

4.1. 商务智能为组织、客户及居品提供瞻念察

4.2. 第一层含义,商务智能指的是一种意会组织诉乞降寻找契机的数据分析行为

4.2.1. 数据分析的成果用来提高组织决策的告捷率

4.3. 第二层含义,商务智能指的是撑合手这类数据分析行为的时代汇注

5. 数据仓库

5.1. Data Warehouse, DW

5.1.1. 主张始于20世纪80年代

5.1.2. 真是实施数据仓库的树立,要到20世纪90年代

5.2. 将不同开首的数据整合到世界的数据模子中去,整合后的数据能为业务运营提供瞻念察,为企业决策撑合手和创造组织价值开辟新的可能性

5.3. 减少企业树立大齐决策撑合手系统(Decision Support System, DSS)的一种技能,大部分DSS系统使用的齐是企业中相通的中枢数据

5.4. 提供了一种减少数据冗余、提高信息一致性,让企业大略应用数据作念出更优决策的步履

5.5. 数据仓库被公合计企业数据料理的中枢

5.6. 一个集成的决策撑合手数据库和与之相关的用于收罗、算帐、解救和存储来自多样操作和外部源数据的软件关节

5.7. 数据集市是数据仓库中数据子集的副本

5.8. 企业级数据仓库(EDW)是连合化的数据仓库,为整个这个词组织的商务智能需求干事

6. 数据仓库树立

6.1. 数据仓库树立指的是数据仓库中数据的抽取、清洗、解救、截止、加载等操作过程

6.2. 非结构化数据指的是无法通过数据模子预界说的数据

7. 数据仓库树立的核情愫念

7.1. 数据仓库存储的数据来自其他系统

7.2. 存储行径包括以进步数据价值的方式整合数据

7.3. 数据仓库便于数据被探听和分析使用

7.4. 组织树立数据仓库,因为他们需要让授权的利益相关方探听到可靠的、集成的数据

7.5. 数据仓库数据树立有好多办法,涵盖使命流撑合手、运营料理和量度分析

8. 企业信息工场

8.1. Inmon

8.1.1. Inmon对于数据仓库的构成是这么描画的:“面向主题的、整合的、随时辰变化的、包含汇总额明细的、流露的历史数据汇注”

8.2. 面向主题的

8.2.1. 数据仓库是基于主要业求实体组织的,而不柔软功能或应用

8.3. 整合的

8.3.1. 数据仓库中的数据是长入的、内聚的

8.4. 随时辰变化的

8.4.1. 数据仓库存储的是某个时辰段的数

8.5. 流露的

8.5.1. 在数据仓库中,数据记载不会像在业务系统里那样频繁更新

8.6. 团员数据和明细数据

8.7. 历史的

8.7.1. 业务系统的要点是现时的数据

8.8. CIF的构成部分

8.8.1. 应用关节

8.8.1.1. 应用关节处理业务进程

8.8.1.2. 应用关节产生的明细数据流转到数据仓库和操作型数据存储中,继而用作分析

8.8.2. 数据暂存区

8.8.2.1. 介于业务系统源数据库和策动数据仓库之间的一个数据库

8.8.3. 集成和解救

8.8.3.1. 在集成层,来自不同数据源的数据被解救整合为数仓和ODS里的圭臬企业模子

8.8.4. 操作型数据存储(ODS)

8.8.4.1. 操作型数据存储是业务数据的集成数据库

8.8.5. 数据集市

8.8.5.1. 数据集市为后续的数据分析提供数据

8.8.6. 操作型数据集市(OpDM)

8.8.6.1. 操作型数据集市是专注于运营决策撑合手的数据集市

8.8.7. 数据仓库

8.8.7.1. 数据仓库为企业数据提供了一个长入的整合进口,以撑合手料理决策、计谋分析和诡计

8.8.8. 运营申报

8.8.8.1. 运营申报从数据存储中输出

8.8.9. 参考数据、主数据和外部数据

8.8.9.1. 除了来自应用关节的走动数据,企业信息工场还包括意会走动所需的数据,如参考数据和主数据

8.9. 数据仓库和数据集市的数据与应用关节中的数据不同

8.9.1. 数据的组织阵势是按主题域而不是按功能需

8.9.2. 数据是整合的数据,而不是“伶仃”的烟囱数据

8.9.3. 数据是随时辰变化的系列数据,而非仅现通常辰的值

8.9.4. 数据在数据仓库中的延长比在应用关节中高

8.9.5. 数据仓库中提供的历史数据比应用关节中提供的历史数据多

9. 多维数据仓库

9.1. Kimball

9.1.1. Kimball的多维数据仓库是数据仓库诱骗的另一个主要模式

9.1.2. Kimball将数据仓库轻便地界说为“专为查询和分析而构建的事务数据的副本”

9.2. 多维模子无为称为星型模子,由事实表(包含相关业务进程的定量数据,Ag百家乐时间差如销售数据)和维度表(存储与事实表数据相关的描画性属性,为数据破钞者解答对于事实表的问题,如这个季度居品X卖了些许)构成

9.3. 数据仓库的总线矩阵展示的是生成事实数据的业务进程和暗意维度的数据主题域的交织

9.4. 业务源系统

9.4.1. 企业中的操作型/走动型应用关节

9.4.2. 这些应用关节产生数据,数据再被集成到操作型数据存储和数据仓库中

9.5. 数据暂存区域

9.5.1. Kimball的暂存区域包括需要集成的进程和用于展示的解救数据,不错与企业信息工场的集成、解救和数据仓库组件的组合进行类比

9.6. 数据展示区域

9.6.1. 与企业信息工场中的数据集市近似,要害的架构互异在于“数据仓库总线”的集成范式,如应用于若干个数据集市的分享或一致的维度

9.7. 数据探听用具

9.7.1. Kimball步履侧重于最终用户的数据需求

9.7.2. 需求股东领受符合的数据探听用具

10. 数据仓库架构组件

10.1. 数据仓库环境包括一系列组织起来以欢娱企业需求的架构组件

10.2. 源系统

10.3. 数据集成

10.3.1. 数据集成包括抽取、解救和加载(此三者英文首字母缩写为E、T、L,无为获胜这把三者称为ETL)、数据凭空化以及将数据解救为通用款式和位置的其他时代

10.4. 数据存储区域

10.4.1. 暂存区

10.4.1.1. 暂存区是介于原始数据源和连合式数据存储库之间的中间数据存储区域

10.4.2. 参考数据和主数据一致性维度

10.4.2.1. 参考数据和主数据不错存储在单独的存储库中

10.4.3. 中央数据仓库

10.4.3.1. 完成解救和准备进程后,数据仓库中的数据无为会保留在中央或原子层中

10.4.4. 数据结构的瞎想元素

10.4.4.1. 基于性能接洽而瞎想的业务主键和代理主键之间的关系

10.4.4.2. 创建索引和外键以撑合手维度表

10.4.4.3. 用于检测、爱戴和存储历史记载的变更数据拿获(Change Data Capture, CDC)时代

10.5. 操作型数据存储(ODS)

10.5.1. 操作型数据存储是中央合手久存储的一个处理有策动,它能撑合手较低的延长,因此不错撑合手业务应用

10.6. 数据集市

10.6.1. 数据集市是一种数据存储,无为用于撑合手数据仓库环境的展示层,还用于呈现数据仓库的部门级或功能级子集,以便对历史信息进行集成报表、查询和分析

10.6.2. 数据集市面向特定主题域、单个部门或单个业务进程

10.7. 数据立方体(Cubes)

10.7.1. 存在三种经典的撑合手在线分析处理系统(OLAP)齐全步履:基于关总共据库的、基于多维数据库的及羼杂型存储结构的,它们的称呼与底层数据库类型相关

11. 加载处理的方式

11.1. 波及两种主要的数据集成处理类型

11.1.1. 历史数据加载

11.1.1.1. 历史数据无为只需要加载一次,或者为了处理数据问题加载有限的几次,然后再也不会加载

11.1.2. 合手续连续的数据更新

11.1.2.1. 需要恒久如一地诡计和奉行,以保证数据仓库中包含最新的数据

11.2. 历史数据

11.2.1. 数据仓库的一个上风是它不错拿获所存储数据的真贵历史记载

11.2.2. Data Vault,手脚数据暂存处理的一部分,相通进行数据清洗和圭臬化

11.3. 批量变更数据拿获

11.3.1. 数据仓库是通过每天晚上的批处理窗口进行一次数据加载干事

11.3.2. 因为不同源系统可能需要不同的变更拿获时代,是以加载过程不错包含多样变更检测

11.3.3. 数据库日记时代可能是里面诱骗应用关节的候选时代,因为购买的供应商应用关节不太可能容忍使用触发器或出奇支拨进行修改

11.3.4. 时辰戳或日记表加载是最常见的时代方式

11.4. 准及时和及时数据加载

11.4.1. 操作型商务智能(或运营分析)的出现股东了更低延长的需求,将更多及时的或准及时的数据集成到数据仓库中,新的架构步履随之出现,用于处理易变化的数据

11.4.2. 涓流式加载(源端积聚)

11.4.2.1. 与夜间窗口批量加载不同,涓流式加载是以更频繁的节律(如每小时以致每5分钟)或者以阈值的方式(如每300个事务,每1G数据)进行批量加载

11.4.3. 音书传送(总线积聚)

11.4.3.1. 当极小的数据报(音书、事件或事务)发布到音书总线时,及时或接近及时的消谢绝互就十分有效

11.4.4. 流式传送(策动端积聚)

11.4.4.1. 与在源端定时或按阀值加载不同,策动端系统用缓冲区或部队方式收罗数据,并按限定处理

11.4.4.2. 交互或团员的成果可能手脚数据仓库的出奇反馈稍后显裸露来百家乐ag真人曝光