如何使用python多次训练SVM分类器?

时间:2019-07-16 01:59:40

标签: python machine-learning scikit-learn svm

是否可以多次训练SVM分类器?因此,我不会在再次运行它时手动更改参数

这是到目前为止我训练模型的代码:

    dictionary = make_Dictionary(TRAIN_DIR)

    print("reading and processing emails from file.")

    features_matrix, labels = extract_features(TRAIN_DIR, dictionary)
    test_feature_matrix, test_labels = extract_features(TEST_DIR, dictionary)

    model = svm.SVC(kernel="poly", degree= 4, C = 0.9)



    print("Training Model")

    #train model
    model.fit(features_matrix, labels)

    predicted_labels = model.predict(test_feature_matrix)

    print("FINISHED classifying. accuracy score : ")

    print (accuracy_score(test_labels, predicted_labels))

1 个答案:

答案 0 :(得分:1)

我的建议是创建要测试的参数列表,然后通过for循环运行它们。假设您要测试四组不同参数上的所有内容(请注意,如果值不符合您的期望,则可以更改它们,只是为了说明这一点而创建):

degreeArr = [3,4,5,6]
CArr = [0.7,0.8,0.9,1]

我假设这些是您希望弄乱的仅有的两个参数。然后,您可以编写for循环:

for x in range(len(degreeArr)): #This assumes degreeArr and CArr are the same length
  model = svm.SVC(kernel='poly', degree=degreeArr[x], C=CArr[x])

  print("Training Model")

  #train model
  model.fit(features_matrix, labels)

  predicted_labels = model.predict(test_feature_matrix)

  print("FINISHED classifying. accuracy score : ")

  print (accuracy_score(test_labels, predicted_labels))

请注意,唯一所做的更改是对模型的更改,因此其余代码保持不变(但必须包含在for循环中)。另一个要注意的是,将仅使用数组中的匹配索引来测试CArr和degreeArr,因为它不是使用double for循环来完成的。如果您想测试这两个数组中的所有可能组合,只需添加另一个for循环并对模型进行一次小的调整即可:

for x in range(len(degreeArr)):
  for i in range(len(CArr)):
    model = svm.SVC(kernel='poly', degree=degreeArr[x], C=CArr[i])

其余的代码将保持不变,就像通过单个for循环完成一样。

让我知道这是否有帮助!