选择导入的文本文件的特定列

时间:2019-02-03 17:09:15

标签: python-3.x

我正在尝试将文本文件导入Python。第一列是日期,其他列是整数。导入文本文件后,我要提取每列,为它们命名并绘制每个变量与日期的关系(第一列)。如何提取列?我该如何选择第二个对话呢?我尝试了两种不同的方法来导入文件:

btcv = np.genfromtxt('example_Feb.388.btcv.txt', dtype=None);

btcv = pd.read_csv('example_Feb.388.btcv.txt', header = None)

文本文件如下:

"2015-06-17 00:00"  -6.830000   -5.642747   -5.642747   -4.057440   -3.867922   -4.377454
"2015-06-18 00:00"  -6.830000   -5.630413   -5.630413   -4.045107   -3.855588   -4.365120
"2015-06-19 00:00"  -5.245973   -5.627623   -5.627623   -3.967911   -3.836147   -4.309624
"2015-06-20 00:00"  -4.568952   -5.620628   -5.620628   -3.871517   -3.837915   -4.238232
"2015-06-21 00:00"  -4.620864   -5.615302   -5.615302   -3.980928   -4.001598   -4.272657
"2015-06-22 00:00"  -4.673435   -5.622433   -5.622433   -4.025599   -4.071035   -4.285809

具有1000行和188列。

我尝试了

btcv.date = btcv[:,0]

,它不起作用! btcv[0]返回完整数组。 谢谢。

1 个答案:

答案 0 :(得分:0)

使用熊猫,您可以将其读取为csv并将分隔符设置为空白

pd.read_csv('example.csv', delim_whitespace=True, header=None)

这会将文件读入pandas数据框。然后,您可以命名您的列。例如

df.columns = ['date',  'first', 'second']

然后您可以按名称访问每个列,例如

date = df.date

将日期设置为框架索引

df.index = df.date

然后使用绘图工具绘制数据框