Cognos 简明教程
Data Warehouse - Overview
数据仓库包含 multiple heterogeneous data sources 中的数据,用于分析报告和决策制定。数据仓库是一个用于存储来自不同数据源和应用程序的数据的中心位置。
数据仓库一词最早是由比尔·因蒙在 1990 年发明的。数据仓库始终有别于操作型数据库。
数据仓库系统中的数据来自操作事务系统,如下所示−
-
Sales
-
Marketing
-
HR
-
SCM, etc.
在加载到数据仓库系统以进行信息处理之前,它可能经过操作数据存储或其他转换。
数据仓库用于报告和分析信息,并存储历史和当前数据。数据仓库系统中的数据用于分析报告,此类报告稍后由业务分析师、销售经理或知识工作者用于决策制定。
在上述图片中,可以看到数据来自 multiple heterogeneous data 源到数据仓库。数据仓库的常见数据源包括−
-
Operational databases
-
SAP and non-SAP Applications
-
平面文件(xls、csv、txt 文件)
业务智能 (BI) 用户通过数据仓库中的数据访问分析报告、数据挖掘和分析。此类数据由业务用户、销售经理、分析师用于决策制定,以定义未来战略。
Features of a Data Warehouse
它是一个集中数据存储库,其中存储来自一个或多个异构数据源的数据。数据仓库系统存储当前和历史数据。通常,数据仓库系统存储 5-10 年的历史数据。数据仓库系统始终与操作事务系统分开。
数据仓库系统中的数据用于从季度到年度比较的不同类型的分析报告。
Data Warehouse Vs Operational Database
数据仓库和操作数据库之间的差异如下−
-
Operational System 设计用于已知工作负载和事务,如更新用户记录、搜索记录等。但是,数据仓库事务更加复杂,并提供通用形式的数据。
-
Operational System 包含组织的当前数据,而数据仓库通常包含历史数据。
-
Operational Database 支持多个事务的并行处理。需要并发控制和恢复机制来维持数据库的一致性。
-
Operational Database 查询允许读取和修改操作(插入、删除和更新),而 OLAP 查询仅需要读取存储数据的只读访问(Select 语句)。
Architecture of Data Warehouse
数据仓库涉及数据清理、数据集成和数据合并。数据仓库具有 3 层架构−
Characteristics of a Data Warehouse
以下是数据仓库的关键特征−
-
Subject Oriented − 在 DW 系统中,数据按照业务主题(如股票期权计划、股票、贷款等)进行分类和存储,而不是由应用程序进行分类和存储。
-
Integrated − 来自多个数据源的数据被集成在数据仓库中。
-
Non Volatile − 数据仓库中的数据是非易失的。这意味着当数据加载到 DW 系统中时,它不会被更改。
-
Time Variant − DW 系统包含历史数据,而事务系统只包含当前数据。在数据仓库中,你可以查看 3 个月、6 个月、1 年、5 年等时间段的数据。
OLTP vs OLAP
首先,OLTP 代表 Online Transaction Processing ,而 OLAP 代表 Online Analytical Processing 。
在 OLTP 系统中,有大量的在线短事务,如 INSERT、UPDATE 和 DELETE。
而对于 OLTP 系统,有效措施是短事务的处理时间,并且非常短暂。它控制多访问环境中的数据完整性。对于 OLTP 系统,每秒事务的数量衡量效率。OLTP 数据仓库系统包含当前和详细的数据,并使用实体模型中的模式(3NF)维护。
For Example −
零售商店中的日常交易系统,其中客户记录每天都会插入、更新和删除。它提供更快的查询处理速度。OLTP 数据库包含详细和当前数据。存储 OLTP 数据库的模式是实体模型。
在 OLAP 系统中,与事务系统相比,事务数量更少。执行的查询本质上很复杂,涉及数据聚合。