从matplotlib条形图的外部文件中解析数据

时间:2013-09-27 16:37:33

标签: python matplotlib

我想从包含两列的文本文件中读取数据。这是对先前提出的问题Generating a matlibplot bar chart from two columns of data的后续跟进。虽然我的问题类似于How to plot data from multiple two column text files with legends in Matplotlib?,但我无法将定义的变量用于条形图。目标是从包含两列的文件中读取数据。

我首先尝试使用当前代码中注释掉的genfromtxt,但接收AttributeError: 'numpy.ndarray' object has no attribute 'split'。这可能是由于数据以数组类型格式读取:

>>> import numpy as np
>>> data = np.genfromtxt('input-file', delimiter = ' ')
>>> print(data)
[[ 72.   1.]
 [  9.   2.]
 [ 10.  36.]
 [ 74.   6.]
 [  0.  77.]
 [  5.   6.]
 [  6.  23.]
 [ 72.   1.]
 [  9.   2.]
 [ 10.  36.]
 [ 82.   1.]
 [ 74.   6.]
 [  0.  97.]
 [  5.   6.]
 [  6.  23.]
 [ 72.   1.]
 [  9.   2.]
 [ 10.  36.]
 [ 82.   1.]]

接下来,我直接读取数据但接收AttributeError: 'file' object has no attribute 'split'

import numpy as np
import matplotlib.pyplot as plt

data = open('input-file', 'r')

#data = np.genfromtxt('input-file', delimiter = ' ')

counts = []
values = []

for line in data.split("\n"):
    x, y = line.split()
    values.append(int(x))
    counts.append(int(y))

#bar_width = 0.25
#opacity = 0.4

plt.bar(values, counts, color='g')
plt.ylabel('Frequency')
plt.xlabel('Length')
plt.title('Title')

plt.show()

来自input-file的示例内容。

72 1
9 2
10 36
74 6
0 77
5 6
6 23
72 1
9 2
10 36
82 1
74 6
0 97
5 6
6 23
72 1
9 2
10 36
82 1

2 个答案:

答案 0 :(得分:1)

文件对象没有拆分功能。您可以直接读取行而不使用split("\n")

for line in data:

答案 1 :(得分:1)

是什么阻止您直接绘制从np.genfromtext返回的numpy数组的列?

data = np.genfromtxt('tmp.dat', delimiter = ' ')

plt.bar(data[:,0], data[:,1], color='g')
plt.ylabel('Frequency')
plt.xlabel('Length')
plt.title('Title')

plt.show()