如何使用引导包进行分层引导?

时间:2019-02-13 02:04:34

标签: r boot resampling

这是一个玩具数据集,可重复我的问题。我很想知道经验分布的置信区间,该分布由每所学校的分数与学生“ A”的比例组成。

set.seed(1)
rows = 50
df <- data.frame(student = sample(LETTERS[1:3],rows,rep=T),
                 school = sample(c("F","G"),rows,rep=T),
                 score = sample(1:10,rows,rep=T,prob = c(rep(0.05,7),rep(0.2167,3)))
                 )
head(df)
student school score
1       A      F     3
2       B      G     9
3       B      F     9
4       C      F     1
5       A      F    10
6       C      F     8
> 

在此示例中:学生“ A”的学校“ G”的分数为3,而学校“ F”的学校的分数为9:

> df[df$student=="A",]
   student school score
1        A      F     3
5        A      F    10
10       A      F    10
11       A      G     1
12       A      F     6
22       A      G    10
24       A      F     8
25       A      F     7
27       A      G    10
34       A      F    10
38       A      F    10
47       A      F     8

我如何生成引导样本,该样本将按学生“ A”学校的正确比例对12个分数进行抽样。我需要计算平均得分学生“ A”的学校比例的期望得分的CI。

我查看了通过“ boot”软件包启动功能的帮助。有一个分层引导的示例,但我不知道stype在做什么。我了解stype =“ i”,但不了解stype =“ w”或“ f”会发生什么以及如何使用它们。

0 个答案:

没有答案