我有一个包含1354个数字的列表(intensityList)。它们的范围从25941.9到1639980000.0,因此存在很大差异,我预计大多数点数接近1639980000.0而不是25941.9。当我用这个
制作直方图时plt.hist(intensityList,20)
plt.title('Amount of features per intensity')
plt.xlabel('intensity')
plt.ylabel('frequency')
plt.show()
它将几乎所有数据都放在一个条形中并弄乱了x轴。它适用于测试集(随机正常数字),所以我很确定它与广泛的范围有关。我该如何处理这样的数据集?
编辑: 数据可能非常偏斜,标准偏差远大于平均值。 (平均值= 6501401.54114,标准devaition = 49423145.7749)
答案 0 :(得分:2)
相当明显的答案,表明当你写下一个问题时它会有所帮助..我记录了这些值,这一切都很花哨
答案 1 :(得分:1)
您可以增加分档数量,或仅保留您感兴趣的范围内的值。
intensityList = intensityList[intensityList < maxVal]
intensityList = intensityList[intensityList > minVal]