Data Mining 简明教程

Data Mining - Overview

信息产业中有大量可用数据。在转换成有用的信息之前,这些数据毫无用处。有必要分析这些海量数据并从中提取有用信息。

信息提取不是我们需要执行的唯一过程;数据挖掘还涉及其他过程,如数据清理、数据集成、数据转换、数据挖掘、模式评估和数据展示。一旦所有这些过程结束,我们就可以在许多应用程序中使用这些信息,例如欺诈检测、市场分析、生产控制、科学探索等。

What is Data Mining?

数据挖掘被定义为从大量数据中提取信息。换句话说,我们可以说数据挖掘是从小知识中挖掘知识的过程。提取的信息或知识可用于以下任何应用程序 -

  1. Market Analysis

  2. Fraud Detection

  3. Customer Retention

  4. Production Control

  5. Science Exploration

Data Mining Applications

数据挖掘在以下领域极有用处 -

  1. Market Analysis and Management

  2. 公司分析和风险管理

  3. Fraud Detection

除此之外,数据挖掘还可用于生产控制、客户保留、科学探索、体育、占星术和互联网 Web Surf-Aid 领域

Market Analysis and Management

以下是数据挖掘使用的各个市场领域 -

  1. Customer Profiling - 数据挖掘有助于确定哪类人购买哪类产品。

  2. Identifying Customer Requirements - 数据挖掘有助于识别适用于不同客户的最佳产品。它使用预测来找到可能吸引新客户的因素。

  3. Cross Market Analysis - 数据挖掘执行产品销售之间的关联/相关性。

  4. Target Marketing - 数据挖掘有助于找到具有相同特征(例如兴趣、消费习惯、收入等)的模型客户群。

  5. Determining Customer purchasing pattern - 数据挖掘有助于确定客户购买模式。

  6. Providing Summary Information − 数据挖掘为我们提供了各种多维摘要报告。

Corporate Analysis and Risk Management

数据挖掘用于企业部门的以下领域 −

  1. Finance Planning and Asset Evaluation − 它涉及现金流分析和预测、或有索赔分析以评估资产。

  2. Resource Planning − 它涉及总结和比较资源和支出。

  3. Competition − 它涉及监控竞争对手和市场方向。

Fraud Detection

数据挖掘还用于信用卡服务和电信领域以检测欺诈行为。在电话诈骗中,它有助于找到通话目的地、通话时长、一天或一周中的时间等。它还分析了与预期规范不同的模式。