ARFF术语中的LIBSVM标签是什么?

时间:2013-11-01 14:41:02

标签: format data-mining libsvm arff

我刚开始使用数据挖掘技术并熟悉一些数据文件格式。我首先看一下* .ARFF和现在的* .LIBSVM 你能告诉我一开始的第一个号码是什么吗?我可以理解ARFF术语中的这个数字

+1 1:70.000000 2:1.000000 3:4.000000 4:130.000000 5:322.000000 6:0.000000 7:2.000000 8:109.000000 9:0.000000 10:2.400000 11:2.000000 12:3.000000 13:3.000000 
-1 1:67.000000 2:0.000000 3:3.000000 4:115.000000 5:564.000000 6:0.000000 7:2.000000 8:160.000000 9:0.000000 10:1.600000 11:2.000000 12:0.000000 13:7.000000 
+1 1:57.000000 2:1.000000 3:2.000000 4:124.000000 5:261.000000 6:0.000000 7:0.000000 8:141.000000 9:0.000000 10:0.300000 11:1.000000 12:0.000000 13:7.000000 
-1 1:64.000000 2:1.000000 3:4.000000 4:128.000000 5:263.000000 6:0.000000 7:0.000000 8:105.000000 9:1.000000 10:0.200000 11:2.000000 12:1.000000 13:7.000000 
-1 1:74.000000 2:0.000000 3:2.000000 4:120.000000 5:269.000000 6:0.000000 7:2.000000 8:121.000000 9:1.000000 10:0.200000 11:1.000000 12:1.000000 13:3.000000 
-1 1:65.000000 2:1.000000 3:4.000000 4:120.000000 5:177.000000 6:0.000000 7:0.000000 8:140.000000 9:0.000000 10:0.400000 11:1.000000 12:0.000000 13:7.000000 

为什么我在http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/

中看到很多+1和-1重复

2 个答案:

答案 0 :(得分:1)

第一个数字是类标签。

答案 1 :(得分:0)

支持向量机使用支持向量来表示正面和负面类别。

第一列最有可能为正例提供+1,为负例提供-1。这就是除了这两个没有其他价值的原因......

您可能需要阅读libsvm的文档:

  

使用LIBSVM的说明位于主目录和一些子目录的README文件中。   主目录中的自述文件:详细说明所有选项,数据格式和库调用。   tools / README:参数选择和其他工具