Question

我有一个包含1354个数字的列表（intensityList）。它们的范围从25941.9到1639980000.0，因此存在很大差异，我预计大多数点数接近1639980000.0而不是25941.9。当我用这个

制作直方图时

plt.hist(intensityList,20)
plt.title('Amount of features per intensity')
plt.xlabel('intensity')
plt.ylabel('frequency')
plt.show()

它将几乎所有数据都放在一个条形中并弄乱了x轴。它适用于测试集（随机正常数字），所以我很确定它与广泛的范围有关。我该如何处理这样的数据集？

编辑：数据可能非常偏斜，标准偏差远大于平均值。（平均值= 6501401.54114，标准devaition = 49423145.7749）

Answer 1

相当明显的答案，表明当你写下一个问题时它会有所帮助..我记录了这些值，这一切都很花哨

Answer 2

您可以增加分档数量，或仅保留您感兴趣的范围内的值。

intensityList = intensityList[intensityList < maxVal]
intensityList = intensityList[intensityList > minVal]