在python中使用matplotib可以通过提供要绘制的项目列表和权重列表来制作简单的直方图,这样每个项目对其所属的bin的贡献将根据其进行调整重量,例如
import matplotlib.pyplot as plt
...
plt.hist(items, weights = weightsOfItems)
我试图将两个值的六边形bin直方图相互映射,可以使用
plt.hexbin(xValues, yValues)
和以前一样,我希望根据权重列表调整每对对其所属的bin的贡献。从hexbin
documentation开始,似乎我可以通过给出参数C的输入来做到这一点,即
plt.hexbin(xValues, yValues, C = weightsOfValues)
然而,这样做会产生完全不正确的情节。目前我已经根据权重首先对xValues和yValues进行采样,以得到xSamples和ySamples。然而,这个过程非常耗时,也意味着我没有使用所有可用的数据,因为我摆脱了样本中未包含的xValues和yValues。
那么,有没有人知道一种生成六边形bin直方图的方法,其中根据给定的权重调整值对各自bin的贡献?
答案 0 :(得分:2)
如果指定了
C
,则会指定坐标(x[i]
,y[i]
)的值。这些值是为每个六边形bin累积的,然后根据reduce_C_function
减少,默认为numpy的平均函数(np.mean
)。 (如果指定了C
,则它也必须是与x
和y
长度相同的1-D序列。)
这意味着对于每个bin,存储相应的C
值,然后将reduce_C_function
应用于它们。由于默认函数是np.mean
,因此结果不是您想要获得的结果,而是平均值而不是总和。要实际获取所有权重的总和,应将其更改为np.sum
,以便对bin中每个C
的值(x,y)
求和,而不是对它们求平均值。
此示例显示了与简单数据的区别:
N = 10**5
x = np.random.normal(size=N)
y = np.random.normal(size=N)
plt.figure(figsize=(12,4)); plt.subplot(131)
plt.hexbin(x,y); plt.colorbar()
plt.subplot(132)
plt.hexbin(x,y,C=np.ones(N)); plt.colorbar()
plt.subplot(133)
plt.hexbin(x,y,C=np.ones(N),reduce_C_function=np.sum)
plt.colorbar(); plt.tight_layout()
现在,对于所有值(从高斯分布生成),权重设置为1,因此加权直方图的正确算法应返回与未加权直方图相同的算法。输出如下:
左侧面板是未加权的绘图,显示2D高斯,中间面板是C
的默认行为,平均每个bin的所有C
值,因此,总计为1箱子和右侧面板是np.sum
的行为,其中检索2D高斯。