我愿意使用SVM来预测sklearn的IRIS数据集的类。使用WEKA我可以使用LibSVM进行100%预测。在Pyton中,LibSVM似乎是在SVR中实现的。所以我尝试使用SVR,但我得到的结果不是类(0,1,2),而是数字(回归的结果)。
如果我使用与WEKA LibSVM相同的参数执行此代码:
import numpy
from sklearn import svm, datasets
# import some data to play with
iris = datasets.load_iris()
X = iris.data
y = iris.target
model = svm.libsvm.fit(kernel = 'rbf', svm_type=0, X=iris.data,
Y=iris.target.astype(numpy.float64), C=10, gamma = 10, epsilon = 0.01, coef0=0, random_seed=0)
pred = svm.libsvm.predict(iris.data, *model)
pred = pred.astype(numpy.int)
print(pred)
我得到以下结果:
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 2 2 2 2 1 2 2 2 2
2 2 1 2 2 2 2 2 1 2 1 2 1 2 2 1 1 2 2 2 2 2 1 2 2 2 2 1 2 2 2 1 2 2 2 2 2
2 1]
而WEKA可能会产生[ 0, ..., 0, 1, ... 1, 2, ..., 2]
。我想知道为什么我不能使用相同的参数得到相同的结果?
答案 0 :(得分:2)
您希望使用SVC
,而不是SVR
,或选择其他SVM classifiers。
你有什么限制迫使你特别使用libsvm?你能不能使用liblinear吗?我不确定这是否重要,因为支持向量分类器继承自抽象基类BaseLibSVM
,这意味着默认情况下SVC
也将使用libsvm。
如果您愿意,您也可以使用svm.libsvm子包。在那里,即使输入数据被视为float64,默认模式为C_SVC
,这意味着它会将浮点目标值视为类标签,预测将是类标签。