这是一个玩具数据集,可重复我的问题。我很想知道经验分布的置信区间,该分布由每所学校的分数与学生“ A”的比例组成。
set.seed(1)
rows = 50
df <- data.frame(student = sample(LETTERS[1:3],rows,rep=T),
school = sample(c("F","G"),rows,rep=T),
score = sample(1:10,rows,rep=T,prob = c(rep(0.05,7),rep(0.2167,3)))
)
head(df)
student school score
1 A F 3
2 B G 9
3 B F 9
4 C F 1
5 A F 10
6 C F 8
>
在此示例中:学生“ A”的学校“ G”的分数为3,而学校“ F”的学校的分数为9:
> df[df$student=="A",]
student school score
1 A F 3
5 A F 10
10 A F 10
11 A G 1
12 A F 6
22 A G 10
24 A F 8
25 A F 7
27 A G 10
34 A F 10
38 A F 10
47 A F 8
我如何生成引导样本,该样本将按学生“ A”学校的正确比例对12个分数进行抽样。我需要计算平均得分学生“ A”的学校比例的期望得分的CI。
我查看了通过“ boot”软件包启动功能的帮助。有一个分层引导的示例,但我不知道stype在做什么。我了解stype =“ i”,但不了解stype =“ w”或“ f”会发生什么以及如何使用它们。