如果有一个数据集如下所示:
data <- data.frame()
data$gender <- c(F,F,F,M,F)
data$province <- c(G,N,K,L,K)
data$volume <- c(500,750,1250,NA,300)
data$weight <- c(1.36,0.67,5.22,1.66,1.14)
如何将这些权重应用于数据集?仅仅将样本权重与数值变量相乘还是分类变量也必须加权?
答案 0 :(得分:2)
questionr
和survey
包处理加权。这是一个例子:
library("questionr")
table <- wtd.table(data$gender, weights = data$weight)
barplot(as.matrix(table))