FitSCVM - 多个类,28x28矩阵,数字介于0和1之间

时间:2015-10-29 16:05:09

标签: matlab machine-learning

我需要使用SVM将28x28矩阵区分为9个类。有60,000个培训输入和10,000个测试输入。

我目前的计划如下:

clear;
load mnist.mat
xtest = xtest ./ 255; <--- Normalizing the data
xtrain = xtrain ./ 255;

SVMModels = cell(9,1);
classes = unique(ytrain);
rng(1); % For reproducibility
blah = fitcsvm(xtrain, ytrain);


for j = 1:numel(classes);
    indx = strcmp(ytrain,classes(j)); % Create binary classes for each classifier
    SVMModels{j} = fitcsvm(xtrain,indx, 'KernelFunction','rbf','BoxConstraint',1);
end

我认为问题是由于输入是28x28。我该如何解决这个问题?

其他信息:

xtest: 28x28x10000
ytest = 1x10000
xtrain = 28x28x60000
ytrain = 1x60000

1 个答案:

答案 0 :(得分:1)

你是对的。 fitcsvm要求输入培训示例为N x P矩阵,其中N是样本总数,P是要素总数。您需要做的就是重塑您的数组,以便xtrainxtest60000 x 784。 784是由28 x 28引起的。具体而言,您必须展开 3D矩阵的每个切片,以使其适合单个矢量。同样,类标签必须为N x 1,因此您只需转置ytrainytest

要实现所需的重塑,请使用reshape,如下所示:

xtrain_final = reshape(xtrain, 784, 60000).'; %'
xtest_final = reshape(xtest, 784, 60000).'; %'
ytrain_final = ytrain.'; %'
ytest_final = ytest.'; %'

现在重塑训练和测试的例子有点奇怪。 MATLAB在重塑时的工作原理是它在主要基础上执行此操作。这意味着当您重塑时,一次需要一列来生成结果。因此,由于矩阵为28 x 28 x 60000,因此3D矩阵的每个切片都为28 x 28。因此,为了便于列主要排序,您可以获取每个2D切片并将其拟合到单个列。因此,您将拥有60000列,对应于60000个训练示例。您现在需要做的最后一件事是转置此结果以获得fitcsvm所需的内容。

现在已经完成,您可以训练您的模型。