Data Mining 简明教程
Data Mining - Systems
各种数据挖掘系统中可供选择。数据挖掘系统可能集成以下技术 −
-
Spatial Data Analysis
-
Information Retrieval
-
Pattern Recognition
-
Image Analysis
-
Signal Processing
-
Computer Graphics
-
Web Technology
-
Business
-
Bioinformatics
Data Mining System Classification
根据以下条件可以对数据挖掘系统进行分类 −
-
Database Technology
-
Statistics
-
Machine Learning
-
Information Science
-
Visualization
-
Other Disciplines
除此之外,还可以根据所挖掘的(a)数据库、所挖掘的(b)知识、所利用的(c)技术和所适应的(d)应用程序对数据挖掘系统进行分类。
Classification Based on the Databases Mined
我们可以根据所挖掘的数据库类型对数据挖掘系统进行分类。可以根据数据模型、数据类型等不同条件对数据库系统进行分类。相应地,数据挖掘系统也进行分类。
例如,如果我们根据数据模型对数据库进行分类,则可能有一个关系、事务、对象关系或数据仓库挖掘系统。
Classification Based on the kind of Knowledge Mined
我们还可以根据所挖掘的知识类型对数据挖掘系统进行分类。这意味着根据诸如以下功能对数据挖掘系统进行分类−
-
Characterization
-
Discrimination
-
Association and Correlation Analysis
-
Classification
-
Prediction
-
Outlier Analysis
-
Evolution Analysis
Integrating a Data Mining System with a DB/DW System
如果数据挖掘系统未与数据库或数据仓库系统集成,则将没有要通信的系统。此方案称为非耦合方案。在这个方案中,重点放在数据挖掘设计以及为挖掘可用数据集开发高效且有效的算法上。
集成方案如下列出 −
-
No Coupling − 在此方案中,数据挖掘系统不利用任何数据库或数据仓库功能。它从特定数据源中获取数据,然后使用一些数据挖掘算法处理该数据。数据挖掘结果存储在另一个文件中。
-
Loose Coupling − 在此方案中,数据挖掘系统可能使用一些数据库和数据仓库系统功能。它从由这些系统管理的数据源中获取数据,然后对该数据执行数据挖掘。然后它将挖掘结果存储在文件中,或存储在数据库或数据仓库中的指定位置。
-
Semi−tight Coupling − 在此方案中,数据挖掘系统与数据库或数据仓库系统链接,此外,可以在数据库中提供一些数据挖掘原始功能的高效实现。
-
Tight coupling − 在此耦合方案中,数据挖掘系统平顺集成到数据库或数据仓库系统中。数据挖掘子系统被视为信息系统的一个功能组件。