我需要使用SVM将28x28矩阵区分为9个类。有60,000个培训输入和10,000个测试输入。
我目前的计划如下:
clear;
load mnist.mat
xtest = xtest ./ 255; <--- Normalizing the data
xtrain = xtrain ./ 255;
SVMModels = cell(9,1);
classes = unique(ytrain);
rng(1); % For reproducibility
blah = fitcsvm(xtrain, ytrain);
for j = 1:numel(classes);
indx = strcmp(ytrain,classes(j)); % Create binary classes for each classifier
SVMModels{j} = fitcsvm(xtrain,indx, 'KernelFunction','rbf','BoxConstraint',1);
end
我认为问题是由于输入是28x28。我该如何解决这个问题?
其他信息:
xtest: 28x28x10000
ytest = 1x10000
xtrain = 28x28x60000
ytrain = 1x60000
答案 0 :(得分:1)
你是对的。 fitcsvm
要求输入培训示例为N x P
矩阵,其中N
是样本总数,P
是要素总数。您需要做的就是重塑您的数组,以便xtrain
和xtest
为60000 x 784
。 784是由28 x 28
引起的。具体而言,您必须展开 3D矩阵的每个切片,以使其适合单个矢量。同样,类标签必须为N x 1
,因此您只需转置ytrain
和ytest
。
要实现所需的重塑,请使用reshape
,如下所示:
xtrain_final = reshape(xtrain, 784, 60000).'; %'
xtest_final = reshape(xtest, 784, 60000).'; %'
ytrain_final = ytrain.'; %'
ytest_final = ytest.'; %'
现在重塑训练和测试的例子有点奇怪。 MATLAB在重塑时的工作原理是它在列主要基础上执行此操作。这意味着当您重塑时,一次需要一列来生成结果。因此,由于矩阵为28 x 28 x 60000
,因此3D矩阵的每个切片都为28 x 28
。因此,为了便于列主要排序,您可以获取每个2D切片并将其拟合到单个列。因此,您将拥有60000列,对应于60000个训练示例。您现在需要做的最后一件事是转置此结果以获得fitcsvm
所需的内容。
现在已经完成,您可以训练您的模型。