Java加倍并使用非常小的值

时间:2012-10-10 04:16:06

标签: java double probability

我必须存储几个非常低的概率值的乘积(例如,1E-80)。由于下溢,使用原始java double将导致零。我不希望该值变为零,因为稍后会有一个更大的数字(例如,1E100),它将使值在双精度可以处理的范围内。

所以,我自己创建了一个不同的类(MyDouble),用于保存基本部分和指数部分。在进行计算时,例如乘法,我乘以基础部分,并添加指数。

程序快速使用原始双精度类型。但是,当我使用自己的类(MyDouble)时,程序非常慢。我认为这是因为每次创建简单操作时我必须创建新对象,而垃圾收集器在不再需要对象时必须做很多工作。

我的问题是,你认为我能解决这个问题有更好的方法吗?如果没有,有没有办法让我可以用自己的班级(MyDouble)加速程序?

[注意:记录日志并稍后取指数并不能解决我的问题]

MyDouble类:

public class MyDouble {
    public MyDouble(double base, int power){
    this.base = base;
    this.power = power;
    }

    public static MyDouble multiply(double... values) {
    MyDouble returnMyDouble = new MyDouble(0);
    double prodBase = 1;
    int prodPower = 0;
    for( double val : values) {
            MyDouble ad = new MyDouble(val);
            prodBase *= ad.base;
            prodPower += ad.power;
        }   
        String newBaseString = "" + prodBase;
        String[] splitted = newBaseString.split("E");   
        double newBase = 0; int newPower = 0;
        if(splitted.length == 2) {
            newBase = Double.parseDouble(splitted[0]);
            newPower = Integer.parseInt(splitted[1]);
        } else {
            newBase = Double.parseDouble(splitted[0]);
            newPower = 0;
        }
        returnMyDouble.base = newBase;
        returnMyDouble.power = newPower + prodPower;        
        return returnMyDouble;
    }
}

6 个答案:

答案 0 :(得分:4)

解决这个问题的方法是在日志空间中工作---它使问题变得微不足道。当你说它不起作用时,你能说明具体原因吗?概率下溢是概率模型中的一个常见问题,我不认为我已经知道它以任何其他方式解决了。

回想一下log(a * b)只是log(a)+ log(b)。类似地,log(a / b)是log(a) - log(b)。我假设你正在处理可能导致下溢问题的乘法和除法;日志空间的缺点是您需要使用特殊例程来计算log(a + b),如果这是您的问题,我可以指导您。

所以简单的答案是,在日志空间中工作,并在最后重新取幂以获得人类可读的数字。

答案 1 :(得分:2)

每次进行乘法运算时都试图解析字符串。为什么不将所有值计算为某些结构(如实数和指数部分)作为预计算步骤,然后创建乘法,加法,细分,幂等算法。

你也可以为大/小号添加标志。我认为你不会在一次计算中同时使用1e100和1e-100(因此你可以简化一些计算),你可以改善不同对(大,大),(小,小),(大,小)的计算时间。

答案 2 :(得分:2)

您可以使用

BigDecimal bd = BigDecimal.ONE.scaleByPowerOfTen(-309)
        .multiply(BigDecimal.ONE.scaleByPowerOfTen(-300))
        .multiply(BigDecimal.ONE.scaleByPowerOfTen(300));
System.out.println(bd);

打印

1E-309

或者如果您使用log10比例

double d = -309 + -300 + 300;
System.out.println("1E"+d);

打印

1E-309.0

答案 3 :(得分:1)

我确信这比双精度慢很多,但可能是一个很大的因素是String操作。你可以摆脱它并通过算术计算功率吗?即使是递归或迭代算法也可能比转换为String以获取该数字的位更快。

答案 4 :(得分:1)

在性能较高的应用程序中,您希望找到一种在基元中存储基本信息的方法。在这种情况下,也许您可​​以拆分long或其他变量的字节,以便固定部分为基础。

然后,您可以创建自定义方法乘以long或Long,就像它们是double一样。你抓住代表base和exp的位,并相应地截断。

在某种意义上,你在这里重新发明了轮子,因为你想要有效地执行你正在寻找的操作的字节代码。

编辑:

如果你想坚持使用两个变量,你可以修改你的代码,只需要一个比对象轻得多的数组。此外,您需要删除对任何字符串解析函数的调用。那些都非常慢。

答案 5 :(得分:1)

缓慢可能是因为在split和string concats中创建的中间字符串对象。

试试这个:

/**
 * value = base * 10 ^ power.
 */

public class MyDouble {

    // Threshold values to determine whether given double is too small or not. 
private static final double SMALL_EPSILON = 1e-8;
private static final double SMALL_EPSILON_MULTIPLIER = 1e8;
private static final int    SMALL_EPSILON_POWER = 8;

private double myBase;
private int    myPower;

public MyDouble(double base, int power){
    myBase  = base;
    myPower = power;
}

public MyDouble(double base) 
{
    myBase  = base;
    myPower = 0;
    adjustPower();
}

/**
 * If base value is too small, increase the base by multiplying with some number and 
 * decrease the power accordingly. 
 * <p> E.g 0.000 000 000 001 * 10^1  => 0.0001 * 10^8  
 */
private void adjustPower()
{
    // Increase the base & decrease the power 
    // if given double value is less than threshold.
    if (myBase < SMALL_EPSILON) {
        myBase = myBase * SMALL_EPSILON_MULTIPLIER;
        myPower -= SMALL_EPSILON_POWER;
    }
}

/**
 * This method multiplies given double and updates this object.
 */
public void multiply(MyDouble d)
{
    myBase  *= d.myBase;
    myPower += d.myPower;
    adjustPower();
}

/**
 * This method multiplies given primitive double value with this object and update the 
 * base and power.
 */
public void multiply(double d)
{
    multiply(new MyDouble(d));
}

@Override
public String toString()
{
    return "Base:" + myBase + ", Power=" + myPower;
}

/**
 * This method multiplies given double values and returns MyDouble object.
 * It make sure that too small double values do not zero out the multiplication result. 
 */
public static MyDouble multiply(double...values) 
{
    MyDouble result = new MyDouble(1);
    for (int i=0; i<values.length; i++) {
        result.multiply(values[i]);
    }
    return result;
}

public static void main(String[] args) {
    MyDouble r = MyDouble.multiply(1e-80, 1e100);
    System.out.println(r);
}

}

如果这仍然很慢,你可以修改multiply()方法直接对原始double进行操作,而不是创建一个MyDouble对象。