SVM:训练后从Scratch-Generate模型开始

时间:2018-03-04 06:36:47

标签: python machine-learning scikit-learn svm sklearn-pandas

如何在训练后生成我的模型?我并没有使用sklearn包来预测。我的代码如下所示:

class SVM(object):

def __init__(self, kernel=polynomial_kernel, C=None):
    self.kernel = kernel
    self.C = C
    if self.C is not None: self.C = float(self.C)

def fit(self, X, y):
    n_samples, n_features = X.shape

    # Gram matrix
    K = np.zeros((n_samples, n_samples))
    for i in range(n_samples):
        for j in range(n_samples):
            K[i,j] = self.kernel(X[i], X[j])

    P = cvxopt.matrix(np.outer(y,y) * K)
    q = cvxopt.matrix(np.ones(n_samples) * -1)
    A = cvxopt.matrix(y, (1,n_samples))
    b = cvxopt.matrix(0.0)

    if self.C is None:
        G = cvxopt.matrix(np.diag(np.ones(n_samples) * -1))
        h = cvxopt.matrix(np.zeros(n_samples))
    else:
        tmp1 = np.diag(np.ones(n_samples) * -1)
        tmp2 = np.identity(n_samples)
        G = cvxopt.matrix(np.vstack((tmp1, tmp2)))
        tmp1 = np.zeros(n_samples)
        tmp2 = np.ones(n_samples) * self.C
        h = cvxopt.matrix(np.hstack((tmp1, tmp2)))

    # solve QP problem
    solution = cvxopt.solvers.qp(P, q, G, h, A, b)

    # Lagrange multipliers
    a = np.ravel(solution['x'])

    # Support vectors have non zero lagrange multipliers
    sv = a > 1e-5
    ind = np.arange(len(a))[sv]
    self.a = a[sv]
    self.sv = X[sv]
    self.sv_y = y[sv]
    print("%d support vectors out of %d points" % (len(self.a), n_samples))

    # Intercept
    self.b = 0
    for n in range(len(self.a)):
        self.b += self.sv_y[n]
        self.b -= np.sum(self.a * self.sv_y * K[ind[n],sv])
    self.b /= len(self.a)


    # Weight vector
    if self.kernel == linear_kernel:
        self.w = np.zeros(n_features)
        for n in range(len(self.a)):
            self.w += self.a[n] * self.sv_y[n] * self.sv[n]
    else:
        self.w = None

def project(self, X):
    if self.w is not None:
        return np.dot(X, self.w) + self.b
    else:
        y_predict = np.zeros(len(X))
        for i in range(len(X)):
            s = 0
            for a, sv_y, sv in zip(self.a, self.sv_y, self.sv):
                s += a * sv_y * self.kernel(X[i], sv)
            y_predict[i] = s
        return y_predict + self.b

def predict(self, X):
    return np.sign(self.project(X))

我试图在我的测试文件中显示我的模型:

self.clf = SVM(C=1000.1)
self.svm_model=self.clf.fit(X, Y)
print(self.svm_model)

输出显示:

  

然后我尝试将模型保存在Pickle中:

    SVM_pkl_filename=QtGui.QFileDialog.getSaveFileName(self,'Save File')

    print ("SVM classifier :: ", self.svm_model)

    #SVM_pkl_filename = 'SVM_model.pkl'
    SVM_model_pkl = open(SVM_pkl_filename, 'wb')
    # Dump the trained SVM classifier with Pickle
    pickle.dump(self.svm_model, SVM_model_pkl)

    # Close the pickle instances
    SVM_model_pkl.close()

我打开已保存的文件,它什么都没显示。我将它与另一个使用Sklearn的Saved模型文件进行了比较,它有一些随机内容。

我的模型的目的是使用Pickle保存并加载它。我使用Pickle训练我的4个数据集,每次训练数据集时我的模型都会更新。并加载模型进行测试。

1 个答案:

答案 0 :(得分:1)

问题出在这一行 - self.svm_model=self.clf.fit(X, Y)

请注意,您尝试将函数fit()的输出存储到self.svm_model,但fit()函数不会返回任何内容。

您必须为fit函数指定return语句,或在self.svm_model函数中就地指定fit()对象。

另外,我对svm_model想要的内容没有明确的看法。是否要保存权重,或者您是否想要一个具有fit()predict()方法的便捷对象,如scikit-learn

您只想保存权重,最后将fit()功能更改为return self.w

pickle不起作用只是其结果。解决svm_model问题后,酸洗应该自行解决。

修改

您的代码中还有另一个条件 -

else:
        self.w = None

它可以返回None的另一个原因。如果不与数据一起执行就很难分辨。

对于酸洗前的检查,您可以进行简单的空检查。

if not self.svm_model: # check not None
    # pickle here