我编写了一个R脚本来循环遍历调查中的一堆变量,并输出加权值,CV,CI等。 我希望它也输出未加权的观测值。
我知道这是一个懒惰的问题,因为我可以自己计算未加权的计数并将其重新加入。我只是在尝试复制将返回“ obs”的状态脚本
svy:tab jdvariable, per cv ci obs column format(%14.4g)
这是我的计算值表:
myresult_year_calc <- svyby(make.formula(newmetricname), # variable to pass to function
by = ~year, # grouping
design = subset(csurvey, geoname %in% jv_geo), # design object with subset definition
vartype = c("ci","cvpct"), # report variation as ci, and cv percentage
na.rm.all=TRUE,
FUN = svymean # specify function from survey package
)
通过使用unwtd.count而不是FUN,我得到了想要的计数。
myresult_year_obs <- svyby(make.formula(newmetricname), # variable to pass to function
by = ~year, # grouping
design = subset(csurvey, geoname %in% jv_geo), # design object with subset definition
vartype = c("ci","cvpct"), # report variation as ci, and cv percentage
na.rm.all=TRUE,
unwtd.count
)
老实说,在写这个问题时,我通过一个解决方案使它达到了98%,但无论如何我都会问,以防有人知道更有效的方法。
myresult_year_calc
和myresult_year_obs
都返回我期望的值,并且如果我使用merge(myresult_year_calc, myresult_year_obs by"year")
我得到了想要的表。这实际上只是给我一个计数,在此示例中为每年,而不是“是”响应为一个计数和“否”为计数。
有什么方法可以通过单个命令获取均值和未加权计数吗?
答案 0 :(得分:0)
我通过创建第二个dsgn函数(权重=〜0)来解决这个问题。当我在不加权的设计中使用svytotal函数运行svyby时,它遵循以下公式。
dsgn2 <- svydesign(ids = ~0,
weights = ~0,
data = data,
na.rm = T)
unweighted_n <- svyby(~interaction(group1,group2), ~as.factor(mean_rating), design = dsgn2, FUN = svytotal, na.rm = T)