我是R的新手,为了考试,他在问一个新手问题。 任何朝着正确方向的观点都会受到赞赏。
使用默认数据集,我们应该使用中位数余额中的差异来创建 95%置信区间按学生状态划分的收入比例。
不确定如何按学生身份找到收入比例。。假设在问题的最后,我应该做一些自举。
答案 0 :(得分:2)
毫无根据,这是我对这个问题的理解:
该比率将在“余额”和“收入”列之间。这是获取该值的方法:
dds$ratio <- dds$balance/dds$income #where dds is your default data set and you may need to replace 'balance and 'income' with whatever is in your dataset
现在,您将需要按状态分组。一种方法是像这样使用dplyr
:
dds %>%
group_by(status) %>% # replace status with whatever your column is named
summarise(Median=median(ratio))
现在,您将需要使用自己认为合适的统计检验并计算相关的95%置信区间。
希望这会有所帮助!