要预测稀有事件的分类,是否有比使用LSTM Keras更简单的方法?

时间:2019-08-07 02:14:13

标签: python machine-learning keras deep-learning lstm

我目前正在研究稀有事件预测,这是我以前从未做过的(我曾经处理过简单的预测问题),我查阅了this article关于使用LSTM进行时间序列稀有事件分类的信息。 / p>

阅读起来非常令人兴奋,因为我认为我的情况有点相似:通过历史活动功能预测母牛的产犊时间,其中产犊只在数据收集结束时发生一次。

但是...除了我的数据比示例小得多之外,使用LSTM引起的混乱也太多了。我期待的LSTM的优点是“回头看”功能,该功能可以让您为每个输出确定上一次回头时有多少输入。

我的问题将是:是否有像LSTM一样适用于时间序列分类的“更轻松”或更简单的机器学习方法?

我尝试使用简单的ML(例如决策树,随机森林),但我认为它不能很好地表示问题(许多历史数据合并为一个输出)。

这个问题也交叉发布在StackExchange上。我知道我应该在这里问更多与编程有关的问题,但我们会提供任何帮助/见解。

1 个答案:

答案 0 :(得分:0)

许多机器学习项目/程序的问题是缺少数据,这是您不希望使用LSTM的原因之一。不仅对于LSTM(尽管也会受到很大的影响),但其他方法也会遇到问题,例如数据过度拟合,对异常值的重视程度更高等,这些问题实际上只能通过更多数据来解决(或微调参数)。

您可能要考虑的一个选项可能是合成数据生成,或者是用于扩展数据集的另一种方法。这样,您将仍然可以使用LSTM,因为它将有更多数据可以运行。

我将链接到我发现对解决小数据问题很有帮助的article。最好的选择是采用简单或基本的ML方法(线性回归就是一个例子)。

如果要尝试将稀有预测与更标准的模式分开(对数据集了解不多,很难说),可以尝试使用SVM。

如果您想选择方差,即罕见的预测,也可以尝试使用PCA来查看最大方差在哪里。

同样,我建议的方法在很大程度上取决于您的数据集,而且我不确定它们对时间序列数据的效果如何。寻找一种扩大数据集的方法将是更可取的选择。

让我知道这是否有帮助!