如何编码不连续的数值

时间:2013-12-20 09:25:04

标签: svm libsvm

我正在为SVM准备数据。一行包含类别值

80, 160, 320, etc. (5*2^n)

实际价值范围是[80:10240]

我想知道是否应该将范围[80:10240]缩放到-1:1并使用简单的功能。

另一种可能性是将范围拆分为8个标记 - 所有值都为-1或1(就像建议用于libsvm指南中的属性特征)

我正在使用SVM的libsvm实现。你能给我一个建议吗,哪种方法会更准确?

1 个答案:

答案 0 :(得分:1)

很难说没有做一些实验,但[80:10240]听起来像是一个很大的范围来挤压-1:1,但仍然可以工作。我认为另一个选择是只取n值(即log(x / 5)),这样你的范围就是[4:11],听起来更容易管理。