从R Survey软件包运行svymean时,可以包括unwtd.count吗?

时间:2019-07-11 14:34:32

标签: r survey

我编写了一个R脚本来循环遍历调查中的一堆变量,并输出加权值,CV,CI等。 我希望它也输出未加权的观测值。

我知道这是一个懒惰的问题,因为我可以自己计算未加权的计数并将其重新加入。我只是在尝试复制将返回“ obs”的状态脚本

svy:tab jdvariable, per cv ci obs column format(%14.4g)

这是我的计算值表:

myresult_year_calc <- svyby(make.formula(newmetricname), # variable to pass to function
by = ~year,  # grouping
design = subset(csurvey, geoname %in% jv_geo), # design object with subset definition
vartype = c("ci","cvpct"), # report variation as ci, and cv percentage
na.rm.all=TRUE,
FUN = svymean # specify function from survey package
)

通过使用unwtd.count而不是FUN,我得到了想要的计数。

myresult_year_obs <- svyby(make.formula(newmetricname), # variable to pass to function
by = ~year,  # grouping
design = subset(csurvey, geoname %in% jv_geo), # design object with subset definition
vartype = c("ci","cvpct"), # report variation as ci, and cv percentage
na.rm.all=TRUE,
unwtd.count
)

老实说,在写这个问题时,我通过一个解决方案使它达到了98%,但无论如何我都会问,以防有人知道更有效的方法。

myresult_year_calcmyresult_year_obs都返回我期望的值,并且如果我使用merge(myresult_year_calc, myresult_year_obs by"year") 我得到了想要的表。这实际上只是给我一个计数,在此示例中为每年,而不是“是”响应为一个计数和“否”为计数。

有什么方法可以通过单个命令获取均值和未加权计数吗?

1 个答案:

答案 0 :(得分:0)

我通过创建第二个dsgn函数(权重=〜0)来解决这个问题。当我在不加权的设计中使用svytotal函数运行svyby时,它遵循以下公式。

dsgn2 <- svydesign(ids = ~0, weights = ~0, data = data, na.rm = T)

unweighted_n <- svyby(~interaction(group1,group2), ~as.factor(mean_rating), design = dsgn2, FUN = svytotal, na.rm = T)