我想知道使用这个中值函数的原因是什么,而不仅仅是计算min + (max - min) / 2
:
// used by the random number generator
private static final double M_E12 = 162754.79141900392083592475;
/**
* Return an estimate of median of n values distributed in [min,max)
* @param min the minimum value
* @param max the maximum value
* @param n
* @return an estimate of median of n values distributed in [min,max)
**/
private static double median(double min, double max, int n)
{
// get random value in [0.0, 1.0)
double t = (new Random()).nextDouble();
double retval;
if (t > 0.5) {
retval = java.lang.Math.log(1.0-(2.0*(M_E12-1)*(t-0.5)/M_E12))/12.0;
} else {
retval = -java.lang.Math.log(1.0-(2.0*(M_E12-1)*t/M_E12))/12.0;
}
// We now have something distributed on (-1.0,1.0)
retval = (retval+1.0) * (max-min)/2.0;
retval = retval + min;
return retval;
}
我的方法唯一的缺点可能是它的确定性,我会说?
整个代码可以在这里找到,http://www.koders.com/java/fid42BB059926626852A0D146D54F7D66D7D2D5A28D.aspx?s=cdef%3atree#L8,顺便说一句。
由于
答案 0 :(得分:8)
[试图在这里覆盖一个范围,因为我不清楚你不理解的是什么]
首先,中位数是中间值。中位数[0,0,1,99,99]为1。
所以我们可以看到给出的代码不是计算中位数(它没有找到中间值)。相反,它是从一些理论分布估计它。正如评论所说。
你给的论坛是中点。如果许多值在min和max之间均匀分布,那么是,这是对中位数的良好估计。在这种情况下(大概),这些值不会以这种方式分配,因此需要一些其他方法。
你可以通过计算上面数字的中点来了解为什么这可能是必要的 - 你的公式会给出49.5。
使用估计的原因可能是它比找到中位数要快得多。进行估算的原因 random 可能会避免多次调用的最坏情况。
最后,抱歉,但我不知道在这种情况下分发是什么。您可能需要搜索数据结构和/或作者姓名以查看是否可以找到纸质或书籍参考(我认为它可能是假定幂律,但请参阅下面的编辑 - 它似乎是添加了一个非常小的修正)(我不确定这是你所要求的,或者你是否更普遍地感到困惑)。
[编辑]看一些,我认为log(...)给予均匀随机t一个中心偏差。所以它基本上按照你的建议行事,但有一些在0.5左右。这是一个plot of one case,表明retval
实际上是一个非常小的调整。
答案 1 :(得分:4)
我无法告诉你这段代码试图实现的目标;一开始它甚至不使用n
!
但从它的外观来看,它只是在[min,max]
范围内生成某种指数分布的随机值。请参阅http://en.wikipedia.org/wiki/Exponential_distribution#Generating_exponential_variates。
有趣的是,谷歌搜索这个神奇的数字会带来很多相关的点击,其中没有一个是有启发性的:http://www.google.co.uk/search?q=162754.79141900392083592475。