是否可以多次训练SVM分类器?因此,我不会在再次运行它时手动更改参数
这是到目前为止我训练模型的代码:
dictionary = make_Dictionary(TRAIN_DIR)
print("reading and processing emails from file.")
features_matrix, labels = extract_features(TRAIN_DIR, dictionary)
test_feature_matrix, test_labels = extract_features(TEST_DIR, dictionary)
model = svm.SVC(kernel="poly", degree= 4, C = 0.9)
print("Training Model")
#train model
model.fit(features_matrix, labels)
predicted_labels = model.predict(test_feature_matrix)
print("FINISHED classifying. accuracy score : ")
print (accuracy_score(test_labels, predicted_labels))
答案 0 :(得分:1)
我的建议是创建要测试的参数列表,然后通过for循环运行它们。假设您要测试四组不同参数上的所有内容(请注意,如果值不符合您的期望,则可以更改它们,只是为了说明这一点而创建):
degreeArr = [3,4,5,6]
CArr = [0.7,0.8,0.9,1]
我假设这些是您希望弄乱的仅有的两个参数。然后,您可以编写for循环:
for x in range(len(degreeArr)): #This assumes degreeArr and CArr are the same length
model = svm.SVC(kernel='poly', degree=degreeArr[x], C=CArr[x])
print("Training Model")
#train model
model.fit(features_matrix, labels)
predicted_labels = model.predict(test_feature_matrix)
print("FINISHED classifying. accuracy score : ")
print (accuracy_score(test_labels, predicted_labels))
请注意,唯一所做的更改是对模型的更改,因此其余代码保持不变(但必须包含在for循环中)。另一个要注意的是,将仅使用数组中的匹配索引来测试CArr和degreeArr,因为它不是使用double for循环来完成的。如果您想测试这两个数组中的所有可能组合,只需添加另一个for循环并对模型进行一次小的调整即可:
for x in range(len(degreeArr)):
for i in range(len(CArr)):
model = svm.SVC(kernel='poly', degree=degreeArr[x], C=CArr[i])
其余的代码将保持不变,就像通过单个for循环完成一样。
让我知道这是否有帮助!