具有不同维度的数据的分类器

时间:2017-01-13 19:06:37

标签: machine-learning classification svm

我需要训练一个分类器,其数据的维数可以变化。例如(这是用于说明的补充日期):

class-1,0,1,2,3
class-2,0,3,2,4,5,7
class-3,1,8,8,8,2,8,0,0,0
:
:
and so on...

我正在尝试使用scikit-learn训练线性SVM,这需要修复维度。较小的dims的简单零填充以匹配最大的dim,这给我带来了令人失望的结果。

我是否应该为这些数据使用不同的分类器?我该怎么做呢?

2 个答案:

答案 0 :(得分:1)

尝试使用特征均值/中值填充,这是处理缺失数据的另一种方法。 这些测量是在相同的点/特征中进行的吗?

答案 1 :(得分:1)

特征哈希是您需要使用的算法将可变长度输入转换为恒定长度输入。然后,您可以使用任何适当的学习算法来转换矢量。

Wikipedia: Feature Hashing