我有一个SVM格式的数据集。 有一行简单:
-1 4:0.0788382 5:0.124138 6:0.117647 11:0.428571 16:0.1 17:0.749633 18:0.843029 19:0.197344 21:0.142856 22:0.142857 23:0.142857 28:1 33:0.0555556 41:0.1 54:1 56:1 64:1 70:1 72:1 74:1 76:1 82:1 84:1 86:1 88:1 90:1 92:1 94:1 96:1 1
有人可以给出这个文件的描述吗?如何阅读这种格式? 谢谢!
答案 0 :(得分:0)
这不是SVM特有的;它是一种通用的列式格式。
第一个条目(本例中为-1)是观察的标签。
其他条目是feature_number : value
个条目对。
在您给定的观察中,标签(分类)为-1(可能"坏事件")。前四个功能(0-3)没有任何价值。特征4-6具有指示值;缺少7-10。这一直持续到生产线的终点。我不确定尾随1
值是什么意思;这种语法对我来说是新的。