具有非常小的概率的准确性

时间:2017-08-02 17:40:53

标签: java math probability

我用Java编写程序需要我计算一些概率,对于更大的输入,概率最终会变得非常小。因此,为了防止下溢问题,我想改为采用日志概率。

但是,我在执行此操作时遇到了麻烦。在计算的每个阶段,可能存在不同数量的选项,需要分配概率,并且每个阶段需要加起来1.概率基于许多不同的变量。我使用以下公式对所有可能性进行总结:

Math.pow(d[i], a) * Math.pow(1/c[i], b)

这给了我一个变量total。然后建立概率p_i,

p_i = (Math.pow(d[i], a) * Math.pow(1/c[i], b)) / total

我的问题是,如何使用日志概率来实现这一点,这样我就不会得到“无限”和“NaN”值,因为这些是我到目前为止所得到的。

1 个答案:

答案 0 :(得分:0)

我认为您应该尝试使用Kahan Summation。它将允许正确地求和而不会失去精确度。

在一些类似C的伪代码中(抱歉,我的Java生锈了,代码未经测试)

double total(int N, double[] d, double[] c, double a, double b) {

    double sum           = 0.0;
    double running_error = 0.0;

    for (int i = 0; i != N; ++i) {
        if (d[i] == 0.0)
            continue;

        if (c[i] == 0.0)
            throw "XXX"; // some error reporting

        double v = 0.0;
        if (d[i] > 0.0 && c[i] > 0.0) {
            // using log trick, if you want
            double lpi = a*Math.log(d[i]) - b*Math.log(c[i]);
            v = Math.exp(lpi);   
        }
        else {
            v = Math.pow(d[i], a) * Math.pow(1.0/c[i], b);
        }

        double difference = v - running_error;
        double temp = sum + difference;
        running_error = (temp - sum) - difference;
        sum = temp;
     }
     return sum;
}