Weka 简明教程
Weka - File Formats
WEKA 支持大量的数据文件格式。以下是完整列表 −
-
arff
-
arff.gz
-
bsi
-
csv
-
dat
-
data
-
json
-
json.gz
-
libsvm
-
m
-
names
-
xrff
-
xrff.gz
它支持的文件类型列在屏幕底部的下拉列表框中。这在下面给出的屏幕截图中显示。
您会注意到它支持多种格式,包括 CSV 和 JSON。默认文件类型是 Arff。
Arff Format
Arff 文件包含两个部分——头和数据。
-
头描述了属性类型。
-
数据部分包含用逗号分隔的数据列表。
作为 Arff 格式的示例,下面显示了从 WEKA 样本数据库加载的 Weather 数据文件 −
从屏幕截图中,您可以推断以下几点 −
-
@relation 标记定义了数据库的名称。
-
@attribute 标记定义属性。
-
@data 标记开始每一行包含逗号分隔字段的数据行列表。
-
属性可以取名义值,如这里所示的外观 −
@attribute outlook (sunny, overcast, rainy)
-
属性可以取真值,如此例中所示 −
@attribute temperature real
-
您还可以设置目标或类变量,如这里所示的 play −
@attribute play (yes, no)
-
目标假设两个名义值,是或否。