我正在尝试进行异常检测,但是在我的情况下,多次出现的某个特定功能应该是异常。我研究的所有算法都认为,在一个非常可变的特征中,如果一个值出现多次,它将被认为是正常的,而一次出现的就是异常。我的教授不会让我们使用统计方法或计数,因为其思想是尝试使用机器学习算法来做到这一点。有没有人有办法甚至可能?
我附带了一些可能没有多大意义的故事,但我认为这是最好的:
1。例如,应用污染率为90%的异常检测算法,并以相反的方式对其进行解释,被认为是正常现象的少数会出现得更多,我会考虑这些异常。
2。将数据与唯一的行匹配,并希望当我预测整个数据中的异常时,它将考虑重复异常
有人知道是否有道理或有其他方法?