我正在使用scikit库,我想使用一类svm算法训练模型以进行异常检测。
我将数据集加载到一个numpy数组中,然后使用该模型训练我的模型。当我在火车数据集本身上使用预测函数时,问题就会显示出来。它有100%错误。 这是我的数据集的一部分:
0 14512369 11697257 7097 12638966 0 47165 45812 4824152 4257525170 1822262282
0 14512369 11697257 7097 12638966 0 47165 45812 4824152 918662578 1822262282
0 14512369 11697257 7097 12638966 0 47165 45812 4824152 244034994 1822262282
import numpy as np
from sklearn import svm
data=np.loadtxt("f.txt")
clf = svm.OneClassSVM(nu=0.1, kernel="rbf", gamma=0.1)
clf.fit(data)
clf.predict(data)
运行上述代码后,我得到一个-1数组,而我期望的数组大部分为+1。 那是什么问题呢?我的数据集或svm参数还是其他?