我正在为SVM准备数据。一行包含类别值
80, 160, 320, etc. (5*2^n)
实际价值范围是[80:10240]
我想知道是否应该将范围[80:10240]缩放到-1:1并使用简单的功能。
另一种可能性是将范围拆分为8个标记 - 所有值都为-1或1(就像建议用于libsvm指南中的属性特征)
我正在使用SVM的libsvm实现。你能给我一个建议吗,哪种方法会更准确?
答案 0 :(得分:1)
很难说没有做一些实验,但[80:10240]听起来像是一个很大的范围来挤压-1:1,但仍然可以工作。我认为另一个选择是只取n值(即log(x / 5)),这样你的范围就是[4:11],听起来更容易管理。