人们总是使用简单的均值和标准差行进。我不知道它的正确用语 - 但它涉及减去一个数据集的平均值然后除以其标准偏差,然后添加另一个数据集意味着它并乘以新数据的标准偏差。
这允许一个gaussIan来近似另一个的轮廓 - 这是贝叶斯更新的一个例子吗?我的问题是如下 - 其他发行版可以用同样的方式处理。例如泊松分布,可以做任何事情来只使用分布形状和速率信息将一个数据集配置文件与另一个数据集配置文件相匹配吗?
答案 0 :(得分:0)
您的正态分布 N ,平均值 m ,标准差 s 。现在,您将 N 的平均值除以 m ,将其标准差除以 s 。这产生正态分布,均值为0( m - m = 0),标准差为1( s / s = 1)。
现在添加新值 x 并乘以新的标准差 y 。你会得到一个新的分布,其中 x (0 + x = x )和标准差 y (1 * y = y )。
这可以应用于其他发行版吗?当然是。您只需相应地操纵分布参数即可。
例如,泊松分布由 rate 定义。如果您的分配 P 的费率为 r ,则可以将费率除以 r 并将其乘以 z 获得一个新的泊松分布,其速率为 z 。
目前尚不清楚您要将其应用于何处。在上面的示例中,您只为另一个参数交换一个参数 - 可以直接完成。如果这些参数本身就是多个基础基础值的聚合,那么这种事情可以派上用场。
让我们假设您有一个泊松分布,其速率参数是数千个单独基值的总和。您可能没有记录当前费率的每个值。但是现在,您了解到您估计 x 的基本值(例如使用旧模型)实际上是 y ,即使您可以更新您的费率无法访问构成费率的所有其他值。