Question

我用Java编写程序需要我计算一些概率，对于更大的输入，概率最终会变得非常小。因此，为了防止下溢问题，我想改为采用日志概率。

但是，我在执行此操作时遇到了麻烦。在计算的每个阶段，可能存在不同数量的选项，需要分配概率，并且每个阶段需要加起来1.概率基于许多不同的变量。我使用以下公式对所有可能性进行总结：

Math.pow(d[i], a) * Math.pow(1/c[i], b)

这给了我一个变量total。然后建立概率p_i，

p_i = (Math.pow(d[i], a) * Math.pow(1/c[i], b)) / total

我的问题是，如何使用日志概率来实现这一点，这样我就不会得到“无限”和“NaN”值，因为这些是我到目前为止所得到的。

Answer 1

我认为您应该尝试使用Kahan Summation。它将允许正确地求和而不会失去精确度。

在一些类似C的伪代码中（抱歉，我的Java生锈了，代码未经测试）

double total(int N, double[] d, double[] c, double a, double b) {

    double sum           = 0.0;
    double running_error = 0.0;

    for (int i = 0; i != N; ++i) {
        if (d[i] == 0.0)
            continue;

        if (c[i] == 0.0)
            throw "XXX"; // some error reporting

        double v = 0.0;
        if (d[i] > 0.0 && c[i] > 0.0) {
            // using log trick, if you want
            double lpi = a*Math.log(d[i]) - b*Math.log(c[i]);
            v = Math.exp(lpi);   
        }
        else {
            v = Math.pow(d[i], a) * Math.pow(1.0/c[i], b);
        }

        double difference = v - running_error;
        double temp = sum + difference;
        running_error = (temp - sum) - difference;
        sum = temp;
     }
     return sum;
}

具有非常小的概率的准确性

1 个答案: