在给定RNG的情况下运行经验PMF的估计和其中的变化

时间:2013-05-02 16:40:21

标签: algorithm random statistics numerical-methods

假设一个黑盒随机数生成器在某个时间间隔内连续发出整数值(对于直接感兴趣的情况,[0,255])。我想估计概率质量函数及其变化的一些度量,我想在新样本进入时定期更新这些估计,而不必存储到目前为止的整个样本集。

  • 请建议用于计算和更新这些估算的数值稳定的算法。
  • 请建议适当衡量PMF的变化。

1 个答案:

答案 0 :(得分:1)

离散分布的pmf只是每个结果的相对比例。创建一个长度为256的数组,初始化为全零。对于每个值,在该索引处递增数组。按观察总数进行缩放,以相对比例(估计概率)表示结果。 Voila,即时经验pmf,即使您有数百万或数十亿的观测值,您也只能存储256个值。如果结果仅限于一个小子集,请使用哈希而不是数组。

给定值和相关计数,您可以构建您喜欢的集中趋势或变化的任何度量。对于变化,您可以考虑范围,四分位数范围或方差和/或标准差。