计算模型性能时的Matlab交叉验证错误

时间:2015-12-18 11:26:40

标签: matlab svm cross-validation

我正在尝试对具有多个分类类的模型执行交叉验证,但是在尝试在每个折叠上更新我的classperf时遇到错误。我收到此错误"索引向量具有无效值。"

我的代码如下:

K = 5; 
N = size(DataSet, 1); 
idx = crossvalind('Kfold', N, K); 
cp = classperf(trainLabel);
for i = 1:K
     ... 
     %Long codes for svmtrain & svmclassify
     ...
     cp = classperf(cp, Group, trueTestLabel); %error on this line
end
cp.CorrectRate

其中trainLabel是一个120 x 1的双倍,由所有项目的真实性得分组成;组是svmclassify在20 x 1 double中获得的结果;和trueTestLabel是使用以下函数获得的20 x 1双重形式的测试类的真实性得分:

trueTestLabel = trainLabel(idx == i, end);

我尝试过转换" Group"和" trueTestLabel"通过使用num2cell函数进入单元格:

 cp = classperf(cp, num2cell(Group), num2cell(trueTestLabel ));

但相反,我得到了一个不同的错误说"当CP对象的类标签是数字时,输出 分类器必须是所有非负整数或NaN' s。

1 个答案:

答案 0 :(得分:0)

我找到了解决问题的方法。显然,在多次阅读classperf的文档之后,我发现问题出在我的“testidx”函数中

classperf(CP, classout, testidx);

之前我在使用

cp = classperf(cp, Group, trueTestLabel);

和trueTestLabel是20 x 1双重形式的测试类的地面实况得分。基本上,从文档中可以看出,testidx是当前验证中使用的观察结果,而不是模型的实际地面实况得分。

我已经非常了解文档,因此面临上述问题。我通过将行修改为

来修复它
cp = classperf(cp, Group, idx == i);

现在可以使用了。如果我仍然使用错误的方法,请纠正我。感谢。