我正在尝试将文本文件导入Python。第一列是日期,其他列是整数。导入文本文件后,我要提取每列,为它们命名并绘制每个变量与日期的关系(第一列)。如何提取列?我该如何选择第二个对话呢?我尝试了两种不同的方法来导入文件:
btcv = np.genfromtxt('example_Feb.388.btcv.txt', dtype=None);
和
btcv = pd.read_csv('example_Feb.388.btcv.txt', header = None)
文本文件如下:
"2015-06-17 00:00" -6.830000 -5.642747 -5.642747 -4.057440 -3.867922 -4.377454
"2015-06-18 00:00" -6.830000 -5.630413 -5.630413 -4.045107 -3.855588 -4.365120
"2015-06-19 00:00" -5.245973 -5.627623 -5.627623 -3.967911 -3.836147 -4.309624
"2015-06-20 00:00" -4.568952 -5.620628 -5.620628 -3.871517 -3.837915 -4.238232
"2015-06-21 00:00" -4.620864 -5.615302 -5.615302 -3.980928 -4.001598 -4.272657
"2015-06-22 00:00" -4.673435 -5.622433 -5.622433 -4.025599 -4.071035 -4.285809
具有1000行和188列。
我尝试了
btcv.date = btcv[:,0]
,它不起作用! btcv[0]
返回完整数组。
谢谢。
答案 0 :(得分:0)
使用熊猫,您可以将其读取为csv并将分隔符设置为空白
pd.read_csv('example.csv', delim_whitespace=True, header=None)
这会将文件读入pandas数据框。然后,您可以命名您的列。例如
df.columns = ['date', 'first', 'second']
然后您可以按名称访问每个列,例如
date = df.date
将日期设置为框架索引
df.index = df.date
然后使用绘图工具绘制数据框