HI我在R中使用了以下方法进行多分类。如何使用交叉验证选择最佳成本?
n <- nrow(hd)
ntrain <- round(n*0.75)
set.seed(314)
tindex <- sample(n, ntrain)
train_iris <- hd[tindex,]
test_iris <- hd[-tindex,]
svm1 <- svm(res~., data=train_iris,
method="C-classification", kernal="radial",
gamma=0.1, cost=10)
答案 0 :(得分:1)
e1071
具有调整超参数值的功能,可从模型中获得更好的性能。下面的示例演示如何在tune
中使用e1071
函数。它从给定范围内找到最佳的cost
参数( cost = 1 给出最佳错误率 0.333 )
hd <- iris
svm_tune <- tune(svm, Species~., data=hd ,kernel ="radial",
ranges = list(cost=c(0.001, 0.01,0.1, 1, 10, 100)))
summary(svm_tune)
# Parameter tuning of ‘svm’:
#
# - sampling method: 10-fold cross validation
#
# - best parameters:
# cost
# 1
#
# - best performance: 0.03333333
#
# - Detailed performance results:
# cost error dispersion
# 1 1e-03 0.74000000 0.15539674
# 2 1e-02 0.74000000 0.15539674
# 3 1e-01 0.10666667 0.07166451
# 4 1e+00 0.03333333 0.04714045
# 5 1e+01 0.04000000 0.05621827
# 6 1e+02 0.05333333 0.06126244