Weka 简明教程

What is Weka?

WEKA——一款开源软件提供了数据预处理、实现多种机器学习算法和可视化工具,使您可以开发机器学习技术并将其应用到实际数据挖掘问题中。WEKA 提供的内容总结在下图中−

weka summarized

如果您观察图像流程的开始,您会明白处理大数据以使其适合机器学习的阶段很多−

首先,您将从现场收集原始数据开始。这些数据可能包含多个空值和不相干的字段。您可以使用 WEKA 中提供的预处理数据工具来清理数据。

然后,您将预处理的数据保存在本地存储中以应用 ML 算法。

接下来,根据您想要开发的 ML 模型的类型,您将选择 Classify, ClusterAssociate 之类的选项之一。 Attributes Selection 允许自动选择特征以创建缩减数据集。

请注意,在每个类别下,WEKA 都提供了多种算法的实现。您将选择您选择的算法,设置所需的 parameters 并针对数据集运行它。

然后,WEKA 会提供模型处理的统计输出。它提供了可视化工具来检查数据。

可以对相同的数据集应用各种模型。然后可以比较不同模型的输出,并选择最符合您目的的模型。

因此,整体而言,使用 WEKA 可以更快地开发机器学习模型。

既然我们已经了解了 WEKA 是什么以及它的作用,接下来一章让我们学习如何在本地计算机上安装 WEKA。