我有一个循环方法运行,它收集具有30个维度(每200毫秒)的15.000个特征向量的数据集。我当前的设置只是将所有原始特征向量提供给具有RBF(径向基函数)的SVM。分类结果相当令人难以置信,因为在时间上成本很高。我知道数据集并不是那么大,因此使用正确的子采样特征向量可以实现实时分类。目标是加快整个分类过程(训练/预测),以达到几毫秒。为了获得无监督的分类方法,我目前运行k-means来标记特征向量。我选择了一些集群结果,并为它们分配了1级,所有其他的分类为0。
现在的想法如下:
也许代替SVM,KNN方法会产生类似的结果? 这种方法有意义吗? 是否有任何改进流程或改变流程以加快流程的想法? 如何确定d的最佳数量?
分类准确度不应因减少时间而受到太大影响。
编辑:数据流挖掘 我刚刚阅读有关数据流挖掘的文章。我认为这个主题很适合我的设置,因为我必须从连续,快速的数据记录中提取知识结构。也许我应该用渐变提升树替换SVM?
谢谢!