我获得了在线调查(配额抽样方法)。为简单起见,假设我们仅在省级和性别级别设置配额。
有人可以告诉我如何使用survey
中的R
包进行倾斜搜索并获得适当的权重以使我的样本更具代表性吗?更具体地说,我不确定如何设置srydesign
对象。我可以挖掘的唯一示例是概率抽样方法。
虚拟数据集如下所示:
PROV <- c('AB', 'BC', 'MB', 'NB', 'NL', 'NT', 'NS', 'NU', 'ON', 'PE', 'QC', 'SK', 'YT')
GENDER <-c("M","F")
set.seed(1000)
survey.data <-data.frame(Province = sample(PROV, 1000, replace = TRUE), Gender = sample(GENDER, 1000, replace = TRUE) )
prop.table(table(survey.data))
#> Gender
#> Province F M
#> AB 0.041 0.037
#> BC 0.034 0.043
#> MB 0.034 0.036
#> NB 0.032 0.048
#> NL 0.039 0.046
#> NS 0.037 0.040
#> NT 0.036 0.028
#> NU 0.039 0.044
#> ON 0.044 0.036
#> PE 0.036 0.047
#> QC 0.041 0.039
#> SK 0.034 0.031
#> YT 0.045 0.033
set.seed(2000)
statscan.data <-data.frame(Province = sample(PROV, 1000, replace = TRUE), Gender = sample(GENDER, 1000, replace = TRUE) )
prop.table(table(statscan.data))
#> Gender
#> Province F M
#> AB 0.039 0.039
#> BC 0.037 0.037
#> MB 0.049 0.033
#> NB 0.031 0.039
#> NL 0.048 0.022
#> NS 0.030 0.034
#> NT 0.045 0.046
#> NU 0.043 0.042
#> ON 0.037 0.037
#> PE 0.033 0.041
#> QC 0.041 0.037
#> SK 0.040 0.039
#> YT 0.050 0.031