生成R中具有不同样本大小的多项随机变量

时间:2018-10-03 05:27:09

标签: r simulation sapply

我需要生成具有不同样本量的多项式随机变量。

假设我已经按如下方式生成了样本量,

samplesize =c(50,45,40,48)

然后,我需要根据此变化的样本大小生成多项式随机变量。我尝试过使用for循环并使用apply函数(sapply)。

使用For循环

p1=c(0.4,0.3,0.3)
for( i in 1:4)
{
xx1[i]=rmultinom(4, samplesize[i], p1)
} 

如果我的代码正确,那么我应该得到一个具有4列3行的矩阵。其中列的总数应等于样本量中的每个值。但是我不明白。

使用Sapply,

sapply( samplesize ,function(x)
{
  rmultinom(10, samplesize[x], p1)
})

我在这里也遇到错误。

那么任何人都可以帮助我找出问题所在吗?

谢谢

3 个答案:

答案 0 :(得分:3)

samplesize <- c(50, 45, 40, 48)
p <- c(0.4, 0.3, 0.3)

## method 1
set.seed(0)
xx1 <- matrix(0, length(p), length(samplesize))
for(i in 1:length(samplesize)) {
  xx1[, i] <- rmultinom(1, samplesize[i], p)
  }
xx1
#     [,1] [,2] [,3] [,4]
#[1,]   24   17   20   24
#[2,]   11   14    8   16
#[3,]   15   14   12    8
colSums(xx1)
#[1] 50 45 40 48

## method 2
set.seed(0)
xx2 <- sapply(samplesize, rmultinom, n = 1, prob = p)
xx2
#     [,1] [,2] [,3] [,4]
#[1,]   24   17   20   24
#[2,]   11   14    8   16
#[3,]   15   14   12    8
colSums(xx2)
#[1] 50 45 40 48

注意:rmultinom不会像其他分布函数say rnorm一样被“向量化”。

set.seed(0)
fail <- rmultinom(length(samplesize), samplesize, p)
#     [,1] [,2] [,3] [,4]
#[1,]   24   19   25   24
#[2,]   11   16   10   17
#[3,]   15   15   15    9
colSums(fail)
#[1] 50 50 50 50

因此必须进行R级for循环或sapply循环或使用糖函数Vectorize

答案 1 :(得分:2)

如果愿意,您可以使用mapply避免循环

samplesize <- c(50, 45, 40, 48)
p <- c(0.4, 0.3, 0.3)

mapply(rmultinom, samplesize, MoreArgs = list(n=1, prob=p))

#     [,1] [,2] [,3] [,4]
#[1,]   15   22   14   18
#[2,]   13    9   14   12
#[3,]   22   14   12   18

答案 2 :(得分:1)

我想我也可以使用带有复制功能的这种方法来解决我的问题,不是吗?

r1= c(0.34,0.33,0.33)
    rep=10
    size=500
    alpha=0.05
    q=0.1

    set.seed(1)
    didnt_vote=rbinom(rep, size, q)
    replicate(n=1,rmultinom(rep,didnt_vote,r1) )