Dwh 简明教程
Data Warehousing - Data Marting
Why Do We Need a Data Mart?
以下是创建数据市集的原因列表:
-
分区数据以实施 access control strategies.
-
通过减少要扫描的数据量来加速查询。
-
将数据细分为不同的硬件平台。
-
以适合用户访问工具的形式构建数据。
Note − 不要出于任何其他原因建立数据市集,因为数据市集的运营成本可能非常高。在建立数据市集之前,请确保数据市集策略适合你的特定解决方案。
Cost-effective Data Marting
按照以下步骤使数据市集具有成本效益:
-
Identify the Functional Splits
-
识别用户访问工具需求
-
Identify Access Control Issues
Identify the Functional Splits
在此步骤中,我们确定组织是否有自然的职能划分。我们寻找部门之间的划分,并确定各部门使用信息的方式是否与组织的其余部分隔离。我们举个例子。
考虑一个零售组织,其中每个商家负责最大化销售一组产品。为此,以下是有价值的信息 -
-
每日销售交易
-
每周销售预测
-
每日库存位置
-
每日股票变动
由于商家对他们不经手的产品不感兴趣,所以数据市集是处理的产品组感兴趣的数据的一个子集。下图显示了面向不同用户的数仓。
以下是在确定功能划分时需要考虑的问题 -
-
部门结构可能发生变化。
-
产品可能从一个部门切换到另一个部门。
-
商家可以查询其他产品的销售趋势,以分析销售情况。
Note - 我们需要确定使用数据市集的业务优势和技术可行性。
Designing Data Marts
数据市集应设计为数据仓库中星型雪花模式的较小版本,并且应与数据仓库的数据库设计相匹配。它有助于控制数据库实例。
摘要以与在数据仓库内设计相同的方式进行数据市集。汇总表有助于利用星型雪花模式中的所有维度数据。