我正在尝试定义一个变量Ytest,它包含10个列条目或来自我的Excel工作表的标签条目。
names = ["Variable1","Variable2","Variable3","Variable4","Variable5","Variable6","Variable7","Variable8","Variable9","label"]
filename = 'C:/Users/qwert/test.csv'
dataframe = read_csv(filename, names=names)
dataframe.head(6)
array = dataframe.values
array.shape
(16259, 10)
X_train= array[0:1162,0:9]
X_train.shape
(1162, 9)
X_test= array[1163:2300,0:9]
X_test.shape
(1137, 9)
y_test=array[1163:2300,10]
y_test.shape
但它给了我错误
IndexError Traceback (most recent call last) <ipython-input-210-d6922be9e642> in <module>() 1 #y_test=array[1163:2300,0:10] ----> 2 y_test=array[1163:2300,10] 3 y_test.shape IndexError: index 10 is out of bounds for axis 1 with size 10
我在这里遗漏了什么吗?我基本上希望我的excel的10列中的所有标签都在y_test
中答案 0 :(得分:0)
Excel中的第10列将在Python中被索引为第9列,因为索引从0开始。所以错误是说,因为你有10列,你只能从0到9调用它们,但调用索引= 10就像调用第11列一样,因此会抛出错误。
如果您需要Excel中的第10列,则应将其设为y_test=array[1163:2300, 9]
。