应用错误收集

群集日志文件消息

时间：2019-07-28 18:23:40

标签： machine-learning logging logfile pattern-recognition

我有一个日志文件作为文本文档，其中包含许多条目，其条目具有类似的结构：timestamp：日志消息。

示例：时间戳：我这样做了；时间戳：我做到了；时间戳：x期间发生错误；时间戳：我这样做了；时间戳：错误消息。

对消息进行聚类的好方法是什么，这意味着找出文件中有多少种不同的消息类型并对其进行计数？

示例：51x x期间发生错误； 1717x我做到了。

这应该在不知道以前的模式的情况下起作用。是否有任何工具，或者我需要自己应用一些机器学习集群机制？

0 个答案:

没有答案