Dwh 简明教程
Data Warehousing - System Managers
系统管理对于数据仓库的成功实施至关重要。最重要的系统管理器包括 −
-
System configuration manager
-
System scheduling manager
-
System event manager
-
System database manager
-
System backup recovery manager
System Configuration Manager
-
系统配置管理器负责数据仓库的设置和配置管理。
-
配置管理器的结构因操作系统而异。
-
在 Unix 配置结构中,配置管理器因供应商而异。
-
配置管理器具有单一的 用户界面。
-
配置管理器界面允许我们控制系统的各个方面。
Note − 最重要的配置工具是 I/O 管理器。
System Scheduling Manager
系统调度管理器负责数据仓库的成功实施。其目的是调度临时查询。每个操作系统都有自己 的调度器,并采用某种形式的批处理控制机制。系统调度管理器必须具备的功能列表如下 −
-
跨群集或 MPP 边界工作
-
处理时差
-
Handle job failure
-
Handle multiple queries
-
Support job priorities
-
重新启动或重新排队处理失败的任务
-
在任务完成时通知用户或流程
-
在系统中断期间维护任务计划
-
重新将任务排队到其他队列
-
支持队列的停止和启动
-
Log Queued jobs
-
Deal with inter-queue processing
Note − 上述列表可用作评估良好调度器的评估参数。
调度器必须能够处理的一些重要任务包括 −
-
每日和临时查询调度
-
执行常规报告要求
-
Data load
-
Data processing
-
Index creation
-
Backup
-
Aggregation creation
-
Data transformation
Note −如果数据仓库在一个群集或 MPP 体系结构上运行,那么系统调度管理器一定要能够跨体系结构运行。
System Event Manager
事件管理器是一种软件。事件管理器管理数据仓库系统上所定义的事件。我们无法手动管理数据仓库,因为数据仓库的结构非常复杂。因此,我们需要一种无需用户干预就能自动处理所有事件的工具。
Note −事件管理器监视事件发生并处理它们。事件管理器还会追踪这个复杂的数据仓库系统中可能出现的大量问题。
Events
事件是由用户或系统本身生成的活动。可以注意到,事件是一个定义活动的可度量、可观察的发生。
下面是一个需要追踪的常见事件列表。
-
Hardware failure
-
某些关键磁盘空间不足
-
A process dying
-
一个进程返回一个错误
-
CPU 使用率超出 805 阈值
-
数据库序列化点上的内部争用
-
缓冲区高速缓存命中率超出或低于阈值
-
一个表达到其最大尺寸
-
Excessive memory swapping
-
一个表因缺乏空间而无法扩展
-
Disk exhibiting I/O bottlenecks
-
临时或排序区域使用率达到某个阈值
-
其他任何数据库共享内存使用情况
事件最重要的事情是,它们应该能够自己执行。事件包定义预定义事件的过程。与每个事件关联的代码称为事件处理程序。此代码在发生事件时执行。
System and Database Manager
系统和数据库管理器可能是两个独立的软件,但它们执行相同的工作。这些工具的目标是自动化某些过程并简化其他过程的执行。选择系统和数据库管理器的标准如下 −
-
increase user’s quota.
-
向用户分配和解除角色
-
向用户分配和解除配置文件
-
perform database space management
-
监视和报告空间使用情况
-
整理碎片化和未使用的空间
-
添加并扩展空间
-
add and remove users
-
manage user password
-
管理汇总或临时表
-
将临时空间从用户分配或反分配
-
从旧的或过时的临时表回收空间
-
管理错误和跟踪日志
-
浏览日志和跟踪文件
-
重定向错误或跟踪信息
-
开启和关闭错误和跟踪记录
-
perform system space management
-
监视和报告空间使用情况
-
清理旧的和未使用的文件目录
-
add or expand space.