从受限制的帕累托分布中抽取随机数

时间:2013-01-24 08:58:05

标签: r random

是R的新手,需要有关如何从Pareto分布的有限区域中抽取随机数的建议,参数s&公测。 (系统:Windows 7,R 2.15.2。)

(1)我在矢量数据$ t中有数据;每个单一数据点我称之为数据& tx

对于这些数据,参数s&在https://stats.stackexchange.com/questions/27426/how-do-i-fit-a-set-of-data-to-a-pareto-distribution-in-r

之后估计帕累托分布的beta
pareto.MLE <- function(X)
{
n <- length(X)
m <- min(X)
a <- n/sum(log(X)-log(m))
return( c(m,a) ) 
}

(2)现在我需要绘制尽可能多的随机数(RndNew)von这个Pareto分布(s,beta,见(1)),因为有观测值(=数据点:数据$ tx)。对于绘图,绘制随机数的区域必须限于RndNewx> = data $ tx的区域;换句话说:RndNewx绝不能小于相应的数据$ tx。

问题:如何告诉R限制帕累托分布的区域,从中抽取随机数为RndNewx&gt; = data $ tx?

万分感谢您的帮助!

1 个答案:

答案 0 :(得分:18)

从截断分布中采样的标准方法有三个步骤。这是一个正态分布的例子,所以你可以得到这个想法。

n <- 1000
lower_bound <- -1
upper_bound <- 1

将CDF应用于下边界和上边界以查找分布边缘的分位数。

(quantiles <- pnorm(c(lower_bound, upper_bound)))
# [1] 0.1586553 0.8413447

来自这些分位数之间均匀分布的样本。

uniform_random_numbers <- runif(n, quantiles[1], quantiles[2])

应用逆CDF。

truncated_normal_random_numbers <- qnorm(uniform_random_numbers)

truncated normal random numbers


帕累托分布的CDF

ppareto <- function(x, scale, shape)
{
  ifelse(x > scale, 1 - (scale / x) ^ shape, 0)
}

反之亦然

qpareto <- function(y, scale, shape)
{
  ifelse(
    y >= 0 & y <= 1,
    scale * ((1 - y) ^ (-1 / shape)),
    NaN
  )
}

我们可以重做上面的例子来使用这些帕累托函数。

n <- 1000
scale <- 1
shape <- 1
lower_bound <- 2
upper_bound <- 10

(quantiles <- ppareto(c(lower_bound, upper_bound), scale, shape))
uniform_random_numbers <- runif(n, quantiles[1], quantiles[2])    
truncated_pareto_random_numbers <- qpareto(uniform_random_numbers, scale, shape)

truncated Pareto distrbution


为了更容易重用此代码,我们可以将其包装到函数中。下限和上限具有与分布范围匹配的默认值,因此如果您未传入值,则将获得非截断的Pareto分布。

rpareto <- function(n, scale, shape, lower_bound = scale, upper_bound = Inf)
{
  quantiles <- ppareto(c(lower_bound, upper_bound), scale, shape)
  uniform_random_numbers <- runif(n, quantiles[1], quantiles[2])    
  qpareto(uniform_random_numbers, scale, shape)
}