在绘制直方图时如何处理巨大的数值差异?

时间:2012-02-09 17:12:48

标签: python matplotlib

我有一个包含1354个数字的列表(intensityList)。它们的范围从25941.9到1639980000.0,因此存在很大差异,我预计大多数点数接近1639980000.0而不是25941.9。当我用这个

制作直方图时
plt.hist(intensityList,20)
plt.title('Amount of features per intensity')
plt.xlabel('intensity')
plt.ylabel('frequency')
plt.show()

它将几乎所有数据都放在一个条形中并弄乱了x轴。它适用于测试集(随机正常数字),所以我很确定它与广泛的范围有关。我该如何处理这样的数据集?

编辑: 数据可能非常偏斜,标准偏差远大于平均值。 (平均值= 6501401.54114,标准devaition = 49423145.7749)

2 个答案:

答案 0 :(得分:2)

相当明显的答案,表明当你写下一个问题时它会有所帮助..我记录了这些值,这一切都很花哨

答案 1 :(得分:1)

您可以增加分档数量,或仅保留您感兴趣的范围内的值。

intensityList = intensityList[intensityList < maxVal]
intensityList = intensityList[intensityList > minVal]