Question

我在没有标题的csv文件中有数据。我需要解析一些列。

数据的一部分：

-1.0,-0.0246259814315,1174.60023796
 1.0,-0.978057706084,1083.19880269
-1.0,0.314271994507,-1472.97760911
-1.0,0.179751565771,231.017267343
1.0,-1.26254374278,-778.271726463
-1.0,0.249969939456,-52.8014826538
1.0,-1.87039747875,-324.235348241

我只需要加载第二列和第三列。我使用train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[1], usecols=[2, 3])但它返回IndexError: list index out of range

Answer 1

IIUC指数从零开始，因此您需要：

train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[1], usecols=[1, 2])

此外，我不知道这是否也意味着您需要更改日期col：

train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[0], usecols=[1, 2])

但是，查看您的数据我不明白如何将第一列或第二列解释为日期时间，因为它们看起来很奇怪

熊猫：从csv解析列

1 个答案: