聚类&分类稀疏大特征

时间:2013-07-29 07:25:03

标签: machine-learning data-mining cluster-analysis classification

我的问题initial features x y theta 在范围[0,255]范围内进行了标准化。

每个object个功能的数量为variable

应用群集,因此每个群集都具有许多功能和优点。每个对象都属于multiple clusters。 在预测阶段,从初始特征(new features)计算每个对象的集群。

每个对象最多属于10 clusters

群集总数为4000

如果我们为每个对象考虑新的features constant,那么我们就有4000个维度 它very large for classify。只有10个功能可能有用,我的功能很少。

我的问题:

我们是否有任何方式可以将这些sparse features分类为最佳性能&哪个分类器对它有用? 注意:我使用局部敏感散列来分类4000维度非常慢的新特征。

1 个答案:

答案 0 :(得分:0)

我使用主成分分析将要素维度减少到10 dim,然后使用 SVM 对新要素进行分类&解决了我的问题。