我对scikit-learn模块很陌生,因此请仔细阅读教程:http://scikit-learn.org/stable/modules/cross_validation.html。但是,我在玩数据时遇到了困难。我想用我的数据尝试交叉验证分数(CVS)方案。有人可以帮帮我吗?
我这里有一个数据文件:https://www.dropbox.com/s/e8xq7qm5gy7lnjw/data.dat?dl=0
'x'和'y'列表示实际值和模型值。我只是想知道我的模型值有多好,因此想要计算CVS。有人可以用代码指导我如何做到这一点?由于我的开始可能缺乏信息,如果需要任何其他信息,请告诉我。
我是这样开始的:
import numpy as np
from sklearn.model_selection import train_test_split, cross_val_score, KFold
from sklearn import datasets
from sklearn import svm
data = np.loadtxt("deviation.dat")
k_fold = KFold(n_splits=3)
for train, test in k_fold.split(data):
print('Train: %s | test: %s' % (train, test))
打印:
Train: [25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74] | test: [ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24]
Train: [ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74] | test: [25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49]
Train: [ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49] | test: [50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74]
但现在我想知道得分是多少?
N.B。:'deviation.dat'只是数据文件的(abs(列x - 列y))。