应用错误收集

在给定RNG的情况下运行经验PMF的估计和其中的变化

时间：2013-05-02 16:40:21

标签： algorithm random statistics numerical-methods

假设一个黑盒随机数生成器在某个时间间隔内连续发出整数值（对于直接感兴趣的情况，[0,255]）。我想估计概率质量函数及其变化的一些度量，我想在新样本进入时定期更新这些估计，而不必存储到目前为止的整个样本集。

请建议用于计算和更新这些估算的数值稳定的算法。
请建议适当衡量PMF的变化。

1 个答案:

答案 0 :(得分：1)

离散分布的pmf只是每个结果的相对比例。创建一个长度为256的数组，初始化为全零。对于每个值，在该索引处递增数组。按观察总数进行缩放，以相对比例（估计概率）表示结果。 Voila，即时经验pmf，即使您有数百万或数十亿的观测值，您也只能存储256个值。如果结果仅限于一个小子集，请使用哈希而不是数组。

给定值和相关计数，您可以构建您喜欢的集中趋势或变化的任何度量。对于变化，您可以考虑范围，四分位数范围或方差和/或标准差。