我正在尝试使用libsvm(Matlab库)来解决回归问题。我有192个实例的数据集。这是我在火车和测试集中划分数据的代码:
idx = [zeros(170,1) ;ones(22,1)];
idx = idx(randperm(192));
train = data(idx==0,:);
train_label = label(idx==0,:);
test = data(idx==1,:);
test_label = label(idx==1,:);
model_1 = svmtrain(train_label,train,'-s 3 -t 2 -c 1 -g 0.01');
model_2 = svmtrain(label,data,'-s 3 -t 2 -c 1 -g 0.01');
[y_hat, Acc,Dec] = svmpredict(test_label, test, model);
如果我使用整个数据集(model_1)训练模型而不是测试集的每个实例,我有不同的预测值,而如果我只使用训练集,我会为每个测试记录获得完全相同的值。我认为这是因为火车设置太小而无法训练好模型所以我尝试使用190个实例进行训练,只有2个进行测试。但即使有这个划分,我得到2个测试实例的相同预测值?代码有问题吗?
答案 0 :(得分:0)
您应该使用缩放,尝试在代码中缩放训练和数据向量