加快分类过程 - PCA与SVM相结合?

时间:2015-11-16 11:35:43

标签: opencv machine-learning svm pca

我有一个循环方法运行,它收集具有30个维度(每200毫秒)的15.000个特征向量的数据集。我当前的设置只是将所有原始特征向量提供给具有RBF(径向基函数)的SVM。分类结果相当令人难以置信,因为在时间上成本很高。我知道数据集并不是那么大,因此使用正确的子采样特征向量可以实现实时分类。目标是加快整个分类过程(训练/预测),以达到几毫秒。为了获得无监督的分类方法,我目前运行k-means来标记特征向量。我选择了一些集群结果,并为它们分配了1级,所有其他的分类为0。

现在的想法如下:

  • 收集具有30(D)维度的所有15.000(N)个特征向量
  • 所有N个特征向量的PCA
  • 使用特征值来确定具有(d)维度(d
  • 投入新的一组(n
  • 特征向量
  • 或:特征向量? 培训svm

也许代替SVM,KNN方法会产生类似的结果? 这种方法有意义吗? 是否有任何改进流程或改变流程以加快流程的想法? 如何确定d的最佳数量?

分类准确度不应因减少时间而受到太大影响。

编辑:数据流挖掘 我刚刚阅读有关数据流挖掘的文章。我认为这个主题很适合我的设置,因为我必须从连续,快速的数据记录中提取知识结构。也许我应该用渐变提升树替换SVM?

谢谢!

0 个答案:

没有答案