如何计算交叉验证分数?

时间:2017-08-04 11:47:35

标签: python machine-learning cross-validation

我对scikit-learn模块很陌生,因此请仔细阅读教程:http://scikit-learn.org/stable/modules/cross_validation.html。但是,我在玩数据时遇到了困难。我想用我的数据尝试交叉验证分数(CVS)方案。有人可以帮帮我吗?

我这里有一个数据文件:https://www.dropbox.com/s/e8xq7qm5gy7lnjw/data.dat?dl=0

'x'和'y'列表示实际值和模型值。我只是想知道我的模型值有多好,因此想要计算CVS。有人可以用代码指导我如何做到这一点?由于我的开始可能缺乏信息,如果需要任何其他信息,请告诉我。

我是这样开始的:

import numpy as np
from sklearn.model_selection import train_test_split, cross_val_score, KFold
from sklearn import datasets
from sklearn import svm

data = np.loadtxt("deviation.dat")
k_fold = KFold(n_splits=3)
for train, test in k_fold.split(data):
 print('Train: %s | test: %s' % (train, test))

打印:

Train: [25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74] | test: [ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24]
Train: [ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74] | test: [25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49]
Train: [ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49] | test: [50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74]

但现在我想知道得分是多少?

N.B。:'deviation.dat'只是数据文件的(abs(列x - 列y))。

0 个答案:

没有答案