是R的新手,需要有关如何从Pareto分布的有限区域中抽取随机数的建议,参数s&公测。 (系统:Windows 7,R 2.15.2。)
(1)我在矢量数据$ t中有数据;每个单一数据点我称之为数据& tx
对于这些数据,参数s&在https://stats.stackexchange.com/questions/27426/how-do-i-fit-a-set-of-data-to-a-pareto-distribution-in-r
之后估计帕累托分布的betapareto.MLE <- function(X)
{
n <- length(X)
m <- min(X)
a <- n/sum(log(X)-log(m))
return( c(m,a) )
}
(2)现在我需要绘制尽可能多的随机数(RndNew)von这个Pareto分布(s,beta,见(1)),因为有观测值(=数据点:数据$ tx)。对于绘图,绘制随机数的区域必须限于RndNewx> = data $ tx的区域;换句话说:RndNewx绝不能小于相应的数据$ tx。
问题:如何告诉R限制帕累托分布的区域,从中抽取随机数为RndNewx&gt; = data $ tx?
万分感谢您的帮助!
答案 0 :(得分:18)
从截断分布中采样的标准方法有三个步骤。这是一个正态分布的例子,所以你可以得到这个想法。
n <- 1000
lower_bound <- -1
upper_bound <- 1
将CDF应用于下边界和上边界以查找分布边缘的分位数。
(quantiles <- pnorm(c(lower_bound, upper_bound)))
# [1] 0.1586553 0.8413447
来自这些分位数之间均匀分布的样本。
uniform_random_numbers <- runif(n, quantiles[1], quantiles[2])
应用逆CDF。
truncated_normal_random_numbers <- qnorm(uniform_random_numbers)
帕累托分布的CDF
ppareto <- function(x, scale, shape)
{
ifelse(x > scale, 1 - (scale / x) ^ shape, 0)
}
反之亦然
qpareto <- function(y, scale, shape)
{
ifelse(
y >= 0 & y <= 1,
scale * ((1 - y) ^ (-1 / shape)),
NaN
)
}
我们可以重做上面的例子来使用这些帕累托函数。
n <- 1000
scale <- 1
shape <- 1
lower_bound <- 2
upper_bound <- 10
(quantiles <- ppareto(c(lower_bound, upper_bound), scale, shape))
uniform_random_numbers <- runif(n, quantiles[1], quantiles[2])
truncated_pareto_random_numbers <- qpareto(uniform_random_numbers, scale, shape)
为了更容易重用此代码,我们可以将其包装到函数中。下限和上限具有与分布范围匹配的默认值,因此如果您未传入值,则将获得非截断的Pareto分布。
rpareto <- function(n, scale, shape, lower_bound = scale, upper_bound = Inf)
{
quantiles <- ppareto(c(lower_bound, upper_bound), scale, shape)
uniform_random_numbers <- runif(n, quantiles[1], quantiles[2])
qpareto(uniform_random_numbers, scale, shape)
}