日志中的模式识别

时间:2019-07-09 17:30:11

标签: algorithm machine-learning pattern-recognition

我有一长串日志,我必须在其中识别每个日志中的模式。模式可以是单行或多行重复n次。 我想解决这个问题,以便单个模型/代码应该能够识别所有其他可能具有其他模式的日志的模式。 解决此问题的最佳方法是什么?使用任何机器学习算法或代码都可以。我只需要解决这个问题的想法。

PS:我已经将所有日志格式化为一种格式,其中每个条目都具有某些属性,例如时间戳,操作等。

示例:

(1)。 a,b,c,d,a,e,f

这里,a重复了多次,所以模式是a。

(2)。 a,b,c,d,a,b,h,g,a,b,q,w

这里,a,b重复了多次,所以模式是a,b

假设,在一系列操作中只有一次操作执行了多次。实际日志具有多种模式,最后必须确定它们。目前,仅确定一种模式应该可以建立我的理解。

考虑一个具有1000行的SQL表。数据是时间序列数据,其中第一个条目是最早的,最后一个条目是最新的。现在,在这样的表格中,如何识别一个模式,该模式可以是在表中的任何时间点重复多次重复的单行或重复多次重复的序列中的行组。

0 个答案:

没有答案