我必须存储几个非常低的概率值的乘积(例如,1E-80)。由于下溢,使用原始java double将导致零。我不希望该值变为零,因为稍后会有一个更大的数字(例如,1E100),它将使值在双精度可以处理的范围内。
所以,我自己创建了一个不同的类(MyDouble),用于保存基本部分和指数部分。在进行计算时,例如乘法,我乘以基础部分,并添加指数。
程序快速使用原始双精度类型。但是,当我使用自己的类(MyDouble)时,程序非常慢。我认为这是因为每次创建简单操作时我必须创建新对象,而垃圾收集器在不再需要对象时必须做很多工作。
我的问题是,你认为我能解决这个问题有更好的方法吗?如果没有,有没有办法让我可以用自己的班级(MyDouble)加速程序?
[注意:记录日志并稍后取指数并不能解决我的问题]
MyDouble类:
public class MyDouble {
public MyDouble(double base, int power){
this.base = base;
this.power = power;
}
public static MyDouble multiply(double... values) {
MyDouble returnMyDouble = new MyDouble(0);
double prodBase = 1;
int prodPower = 0;
for( double val : values) {
MyDouble ad = new MyDouble(val);
prodBase *= ad.base;
prodPower += ad.power;
}
String newBaseString = "" + prodBase;
String[] splitted = newBaseString.split("E");
double newBase = 0; int newPower = 0;
if(splitted.length == 2) {
newBase = Double.parseDouble(splitted[0]);
newPower = Integer.parseInt(splitted[1]);
} else {
newBase = Double.parseDouble(splitted[0]);
newPower = 0;
}
returnMyDouble.base = newBase;
returnMyDouble.power = newPower + prodPower;
return returnMyDouble;
}
}
答案 0 :(得分:4)
解决这个问题的方法是在日志空间中工作---它使问题变得微不足道。当你说它不起作用时,你能说明具体原因吗?概率下溢是概率模型中的一个常见问题,我不认为我已经知道它以任何其他方式解决了。
回想一下log(a * b)只是log(a)+ log(b)。类似地,log(a / b)是log(a) - log(b)。我假设你正在处理可能导致下溢问题的乘法和除法;日志空间的缺点是您需要使用特殊例程来计算log(a + b),如果这是您的问题,我可以指导您。
所以简单的答案是,在日志空间中工作,并在最后重新取幂以获得人类可读的数字。
答案 1 :(得分:2)
每次进行乘法运算时都试图解析字符串。为什么不将所有值计算为某些结构(如实数和指数部分)作为预计算步骤,然后创建乘法,加法,细分,幂等算法。
你也可以为大/小号添加标志。我认为你不会在一次计算中同时使用1e100和1e-100(因此你可以简化一些计算),你可以改善不同对(大,大),(小,小),(大,小)的计算时间。
答案 2 :(得分:2)
您可以使用
BigDecimal bd = BigDecimal.ONE.scaleByPowerOfTen(-309)
.multiply(BigDecimal.ONE.scaleByPowerOfTen(-300))
.multiply(BigDecimal.ONE.scaleByPowerOfTen(300));
System.out.println(bd);
打印
1E-309
或者如果您使用log10比例
double d = -309 + -300 + 300;
System.out.println("1E"+d);
打印
1E-309.0
答案 3 :(得分:1)
我确信这比双精度慢很多,但可能是一个很大的因素是String操作。你可以摆脱它并通过算术计算功率吗?即使是递归或迭代算法也可能比转换为String以获取该数字的位更快。
答案 4 :(得分:1)
在性能较高的应用程序中,您希望找到一种在基元中存储基本信息的方法。在这种情况下,也许您可以拆分long或其他变量的字节,以便固定部分为基础。
然后,您可以创建自定义方法乘以long或Long,就像它们是double一样。你抓住代表base和exp的位,并相应地截断。
在某种意义上,你在这里重新发明了轮子,因为你想要有效地执行你正在寻找的操作的字节代码。
编辑:
如果你想坚持使用两个变量,你可以修改你的代码,只需要一个比对象轻得多的数组。此外,您需要删除对任何字符串解析函数的调用。那些都非常慢。
答案 5 :(得分:1)
缓慢可能是因为在split和string concats中创建的中间字符串对象。
试试这个:
/**
* value = base * 10 ^ power.
*/
public class MyDouble {
// Threshold values to determine whether given double is too small or not.
private static final double SMALL_EPSILON = 1e-8;
private static final double SMALL_EPSILON_MULTIPLIER = 1e8;
private static final int SMALL_EPSILON_POWER = 8;
private double myBase;
private int myPower;
public MyDouble(double base, int power){
myBase = base;
myPower = power;
}
public MyDouble(double base)
{
myBase = base;
myPower = 0;
adjustPower();
}
/**
* If base value is too small, increase the base by multiplying with some number and
* decrease the power accordingly.
* <p> E.g 0.000 000 000 001 * 10^1 => 0.0001 * 10^8
*/
private void adjustPower()
{
// Increase the base & decrease the power
// if given double value is less than threshold.
if (myBase < SMALL_EPSILON) {
myBase = myBase * SMALL_EPSILON_MULTIPLIER;
myPower -= SMALL_EPSILON_POWER;
}
}
/**
* This method multiplies given double and updates this object.
*/
public void multiply(MyDouble d)
{
myBase *= d.myBase;
myPower += d.myPower;
adjustPower();
}
/**
* This method multiplies given primitive double value with this object and update the
* base and power.
*/
public void multiply(double d)
{
multiply(new MyDouble(d));
}
@Override
public String toString()
{
return "Base:" + myBase + ", Power=" + myPower;
}
/**
* This method multiplies given double values and returns MyDouble object.
* It make sure that too small double values do not zero out the multiplication result.
*/
public static MyDouble multiply(double...values)
{
MyDouble result = new MyDouble(1);
for (int i=0; i<values.length; i++) {
result.multiply(values[i]);
}
return result;
}
public static void main(String[] args) {
MyDouble r = MyDouble.multiply(1e-80, 1e100);
System.out.println(r);
}
}
如果这仍然很慢,你可以修改multiply()方法直接对原始double进行操作,而不是创建一个MyDouble对象。