假设一个黑盒随机数生成器在某个时间间隔内连续发出整数值(对于直接感兴趣的情况,[0,255])。我想估计概率质量函数及其变化的一些度量,我想在新样本进入时定期更新这些估计,而不必存储到目前为止的整个样本集。
答案 0 :(得分:1)
离散分布的pmf只是每个结果的相对比例。创建一个长度为256的数组,初始化为全零。对于每个值,在该索引处递增数组。按观察总数进行缩放,以相对比例(估计概率)表示结果。 Voila,即时经验pmf,即使您有数百万或数十亿的观测值,您也只能存储256个值。如果结果仅限于一个小子集,请使用哈希而不是数组。
给定值和相关计数,您可以构建您喜欢的集中趋势或变化的任何度量。对于变化,您可以考虑范围,四分位数范围或方差和/或标准差。