使用libsvm easy.py规范化训练集和测试集

时间:2015-01-08 01:13:18

标签: python scale normalization libsvm

我非常接近svm。我有两个文件trainingSeta.datatestingSeta.data。这些罚款的格式正如FAQ中所述。我正在尝试规范化两个文件中的数据。但无法理解指南以缩放它们。

它说我应该使用svm-scale但它似乎没有用。这两个文件与svm-scale位于同一文件夹中。在指南上他们的文件是something.scale和something.t.scale。我不明白如何将我的文件转换为该格式以及如何规范化我的数据。我应该使用svm-scale还是easy.py

任何帮助将不胜感激。

我解决了。

如何关闭问题?

1 个答案:

答案 0 :(得分:0)

svm-scale可以同时做到

  • 或扫描数据以获取功能范围,比例数据和写入范围文件。
  • 使用现有范围文件来扩展数据

来自libsvm faq

Q: Should I scale training and testing data in a similar way?
Yes, you can do the following:
> svm-scale -s scaling_parameters train_data > scaled_train_data
> svm-scale -r scaling_parameters test_data > scaled_test_data

我在常见问题解答中缺少的是 - 您必须对测试和培训数据使用相同的范围文件。