标签: machine-learning classification anomaly-detection
我有一系列带有json格式时间戳的日志,需要将其分类为成功和失败(失败类具有适当的推理,如失败的原因)。这里的日志没有标签,因此使用无监督模型是显而易见的。分类应该集中在关联两个或多个日志以查找故障,因为只能通过分析一组实例来检测故障情况。
我已经尝试过K均值聚类,在这种情况下可以很好地获得输出,但是由于没有标签来计算准确性,因此无法弄清它们是正确还是错误,并且该聚类不涉及数据集(即分析两个或更多日志以查找故障)
实际输出为二进制(0或1),但我希望输出是其失败的有意义的原因