我正在写有关父母如何推销其子女的推文。我的数据集包含一个度量变量(情感分析后的情绪得分)和2个二分变量(孩子的性别:“儿子”,女儿,父母的性别:“女”,“男”)。
现在,我想创建一个称为“组合”的新类别变量。所以我得到了母亲/女儿,母亲/儿子,父亲/女儿,父亲/儿子来创建箱线图mit装置和sd(由4组组成)。 有谁知道如何做到这一点?
答案 0 :(得分:2)
0 is produced
1 is produced
2 is produced
3 is produced
4 is produced
0 is consumed
1 is consumed
2 is consumed
3 is consumed
4 is consumed
5 is produced
专用于此类情况。它所做的远不止于粘贴:结果是将x和y的所有可能组合作为等级的一个因素-例如,如果数据中没有“父亲/女儿”组合,则该等级仍为默认情况下得出的因子(可以通过设置interaction
来得出结果):
drop = TRUE
答案 1 :(得分:1)
# example dataset
df <- data.frame(
score = runif(100, 1, 10),
child = sample(c("son", "daughter"), 100, replace=TRUE),
parent = sample(c("mother", "father"), 100, replace=TRUE)
)
# boxplot of 4 child*parent combinations
boxplot(score ~ child:parent, data=df)
答案 2 :(得分:0)
一种快速的解决方案是将性别标签粘贴在一起
this.fd.form
答案 3 :(得分:0)
这里的其他答案很好。如果您需要一个中间步骤,这是一种惰性方法,它将创建您的combination
变量以用于其他分析,然后尝试
data$combination <- paste(data$parent, data$child, sep = ".")