Question

我使用python并且我已经将numpy / scipy作为依赖项。如果他们经过充分测试等等，可以提供更多。

假设我的数据集具有相对较少的不同值，每个数据集都具有较高的多重性。我将它表示为地图（值 - >多重性），比如

{ 1: 10000, 5: 100000, 6: 73452 }

我需要在这里做一些基本的统计，比如均值和方差。这里有两个明显的答案：

将地图展开为大型数组[1, 1, 1, 1...., 5, 5, 5, ...., 6, 6, 6 ...]并致电np.mean和np.var，依此类推。
手工编写统计数据

这些方法有利有弊。

在numpy / scipy堆栈中是否有办法对具有多重性的值集进行统计？