我在没有标题的csv文件中有数据。我需要解析一些列。
数据的一部分:
-1.0,-0.0246259814315,1174.60023796
1.0,-0.978057706084,1083.19880269
-1.0,0.314271994507,-1472.97760911
-1.0,0.179751565771,231.017267343
1.0,-1.26254374278,-778.271726463
-1.0,0.249969939456,-52.8014826538
1.0,-1.87039747875,-324.235348241
我只需要加载第二列和第三列。我使用train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[1], usecols=[2, 3])
但它返回IndexError: list index out of range
答案 0 :(得分:1)
IIUC指数从零开始,因此您需要:
train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[1], usecols=[1, 2])
此外,我不知道这是否也意味着您需要更改日期col:
train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[0], usecols=[1, 2])
但是,查看您的数据我不明白如何将第一列或第二列解释为日期时间,因为它们看起来很奇怪