计算n i.i.d之和的95%置信区间。指数随机变量

时间:2008-12-17 00:18:36

标签: language-agnostic math statistics

让我们实际上推广到c - 置信区间。让公共速率参数为a。 (请注意,速率参数a的指数分布均值为1/a。)

首先找到n这样的i.i.d之和的cdf。随机变量。用它来计算总和的c - 置信区间。请注意,总和的最大似然估计值(MLE)为n/a,即单次平均值的n倍。

背景:这是我编写的一个程序,用于通过随机样本进行时间估计。如果我根据泊松过程采样(即样本之间的间隙具有指数分布)并且在活动X期间发生n,那么对活动X的持续时间有什么好的估计?我很确定答案就是这个问题的答案。

3 个答案:

答案 0 :(得分:2)

正如John D. Cook暗示的那样,i.i.d的总和。指数随机变量具有伽马分布 这是带有速率参数a的n个指数随机变量之和的cdf(用Mathematica表示):

F[x_] := 1 - GammaRegularized[n, a*x];

http://mathworld.wolfram.com/RegularizedGammaFunction.html

逆cdf是:

Fi[p_] := InverseGammaRegularized[n, 1 - p]/a;

然后是c置信区间

ci[c_, a_, n_] := {Fi[a, n, (1-c)/2], Fi[a, n, c+(1-c)/2]}

以下是一些经验验证上述内容正确无误的代码:

(* Random draw from an exponential distribution given rate param. *)
getGap[a_] := -1/a*Log[RandomReal[]]

betw[x_, {a_, b_}] := Boole[a <= x <= b]

c = .95;
a = 1/.75;
n = 40;
ci0 = ci[c, a, n];
N@Mean@Table[betw[Sum[getGap[a], {n}], ci0], {100000}]

----> 0.94995

答案 1 :(得分:1)

提示:独立指数随机变量的总和是一个伽马随机变量。

答案 2 :(得分:1)

我会使用Chernoff bound,你可以从中即兴创作一个区间,因为这个表达式是非常普遍的,你可以解决这个问题,使得有界范围是错误的&lt; 0.05的时间。

Chernoff界限只是你可以在iid变量上得到的最强大的界限,而不需要知道过多的矩生成函数。