我喜欢这样绘制直方图:
data = [-0.5, 0.5, 0.5, 0.5,
1.5, 2.1, 2.2, 2.3, 2.4, 2.5, 3.1, 3.2]
plt.hist(data, bins=5, range=[-1, 4], histtype='step')
现在,当我以某种方式输入大量数据(大于我的内存)时,我需要按块填充直方图块。例如。像这样:
H, bins = np.histogram([], bins=5, range=[-1, 4])
for data in a_lot_of_input_files:
H += np.histogram(data, bins=5, range=[-1, 4])[0]
但问题始终是,“我如何再次绘制此H
,所以它看起来就像以前的matplotlib版本。
我提出的解决方案,看起来像这样:
plt.plot(bins, np.insert(H, 0, H[0]), '-', drawstyle='steps')
但是,既不会看到结果相同,也不会创建H
的副本来绘制它。
我缺少一些优雅的解决方案吗? (我还没有尝试使用plt.bar
,因为当想要比较直方图时,条形图不能正常工作)
答案 0 :(得分:3)
不确定你的意思"条形图不能很好地工作,当想要比较直方图",
执行此操作的一种方法是使用plt.bar
:
import matplotlib.pyplot as plt
import numpy as np
data = [-0.5, 0.5, 0.5, 0.5,
1.5, 2.1, 2.2, 2.3, 2.4, 2.5, 3.1, 3.2]
plt.hist(data, bins=5, range=[-1, 4], histtype='step',edgecolor='r',linewidth=3)
H, bins = np.histogram(data[:6], bins=5, range=[-1, 4])
H+=np.histogram(data[6:], bins=5,range=[-1, 4])[0]
plt.bar(bins[:-1],H,width=1)
plt.show()
另一种选择是plt.step
:
import matplotlib.pyplot as plt
import numpy as np
data = [-0.5, 0.5, 0.5, 0.5,
1.5, 2.1, 2.2, 2.3, 2.4, 2.5, 3.1, 3.2]
plt.hist(data, bins=5, range=[-1, 4], histtype='step',edgecolor='r')
H, bins = np.histogram(data[:6], bins=5, range=[-1, 4])
H+=np.histogram(data[6:], bins=5,range=[-1, 4])[0]
bincentres = [(bins[i]+bins[i+1])/2. for i in range(len(bins)-1)]
plt.step(bincentres,H,where='mid',color='b',linestyle='--')
plt.ylim(0,6)
plt.show()
边缘不会一直延伸,所以你可能需要在任何一端添加一个0-bin,如果这对你来说是个大问题