Python中10倍交叉验证代码中的错误

时间:2018-07-09 18:23:15

标签: python validation machine-learning data-science

我从零开始在Python中实现了10倍交叉验证。语言是Python 3.6,我是在Spyder(Anaconda)中编写的。我的输入形状是data =(1440,390),label =(1440,1)。

我的代码:

def partitions(X,y):
  np.random.shuffle(X)
  foldx=[]
  foldy=[]
  j=0
  for i in range(0,10):
    foldx[i]=X[j:j+143,:]
    foldy[i]=y[foldx[j]]
    j+=144
  return np.array(foldx),np.array(foldy)

def cv(X,y,model):
  trainx,trainy=partitions(X,y)
  scores=[]
  for i in range(0,10):
    xtest=trainx[i]
    ytest=trainy[xtest]
    xtrain=trainx[:i]+trainx[i+1:]
    ytrain=trainy[xtrain]
    model.fit(xtrain,ytrain)
    preds=model.predict(xtest)
    print(accuracy_score(np.ravel(ytest),preds))
    scores.append(accuracy_score(np.ravel(ytest),preds))
  return scores.mean()

错误来自

foldx[i]=X[j:j+143,:]

它说

  

IndexError:列表分配索引超出范围。

我该如何纠正?我对从头开始实施此类问题没有丰富的经验。

1 个答案:

答案 0 :(得分:0)

您必须首先填充列表以使用其索引,将foldx[i]=X[j:j+143,:]行更改为

 foldx.append(X[j:j+143,:])

类似foldy

foldy.append(y[foldx[j]])