支持向量机模型应该具体如何?

时间:2017-12-20 16:00:58

标签: machine-learning statistics svm prediction

使用SVM的重点是算法能够决定输入是真还是假等等。

我正在尝试使用SVM进行预测性维护,以预测系统过热的可能性。

对于我的例子,范围是0-102°C,如果温度达到80°C或更高,则被归类为失败。

我的输入是30个双打(最后30个读数)的数组。

我正在制作一些样本输入来训练SVM,我想知道传递非常具体的数据来训练它是否是一个好习惯 - 例如,在80°C,81°C ... 102°C的阵列中传递模型会自动将这些值与失败相关联。你也可以做一个30 x 79°C的数组并将其设置为通过。

这似乎是一种完整的方法,尽管如果你输入这样的数组 - 它与硬编码一个switch语句在温度读数为80-> 102°C时触发不一样。

传递这些“硬编码”样式数组或者我应该坚持使用更多随机输入是不是一个好主意?

1 个答案:

答案 0 :(得分:1)

如果存在一组有限的可能性,我建议使用NaïveBayes,因为该方法可以完美地解决这个问题。但是,如果您被迫使用SVM,我会说这将是相当困难的。对于初学者来说,使用SVM的主要想法是将其用于分类,并且场景的数量并不重要。然而,输入很少是离散的,所以我猜通常会有无限的情况。但是,正常实施的SVM只会给你一个分类,除非你有100个类,一个1%,另一个2%,这不会真正解决问题。

结论是这可行,但不会被视为“最佳做法”。您可以想象您的30维向量空间被划分为100个小的子空间,每个数据点,30x1向量是该向量空间中的一个点,因此概率由其所在的100个子集中的哪一个决定。但是,有100个类和数据不是很干净或不够,会导致非常糟糕,表现不佳的模型。

干杯:)