实时缩放LibSVM的数据

时间:2018-02-15 11:58:24

标签: svm scaling libsvm feature-extraction

我正在使用LibSVM对数据进行分类。我在区间[-1 1]上使用线性缩放的特征数据训练和测试分类器。建立一个产生可接受精度的模型后,我想对几乎实时定期到达的新数据进行分类。

我不知道如何重新调整“实时”功能列的功能列。间隔为[-1 1]的数据,因为我只为该输入数据生成1行特征。如果我要存储测试/训练集数据特征列的最小值/最大值(以便扩展新数据),则表示如果新的实时数据不落入此最小/最大范围,则可能该模型不再有效,因为我必须重新调整所有先前的数据以适应新的最小/最大值并生成新模型。

我已经考虑过使用其他缩放技术,例如均值归一化,但我读过SVM在线性缩放功能方面效果特别好,所以我对使用其他方法犹豫不决。

如果新要素是单行向量,并且可能具有比重新调整训练数据时使用的最大/最小特征值更高/更低的特征值,那么如何处理将新要素重新缩放到线性间隔?

这是我用来重新调整训练/测试功能集的等式。

Scoure: https://en.wikipedia.org/wiki/Feature_scaling

即使一个人使用另一种特征缩放技术(例如均值归一化),每增加一次实时'分类,在重新缩放之前重新计算ALL(新的,测试和训练)数据的平均值,最小值和最大值是否谨慎,或者是否可以使用训练/测试中存储的缩放值来接收新样本 - 直到&# 34;再训练"分类器将考虑所有新获得的数据。

总而言之,我认为我遇到的问题是:如何处理线上特征缩放的问题在线'分类问题?

0 个答案:

没有答案