我对A列中定义的每个类别中B列中答案的多样性感兴趣。
我可以轻松地提取这些数据,但我很难找到将其放入新列的方法。
我的数据目前如下:
A B
1 X
1 X
1 Z
1 Z
2 X
2 Y
2 Z
2 Z
2 Z
3 X
3 X
3 X
4 Y
4 Z
我目前用于定义多样性的代码如下:
df %>% count(A, B) %>%
summarize(B.diversity = n())
这将返回有关我想要的多样性的信息,并注明A列中每个类别中不同回答的数量。
但是,我希望在每个类别中使用该信息填充C列,如下所示:
A B C
1 X 2
1 X 2
1 Z 2
1 Z 2
2 X 3
2 Y 3
2 Z 3
2 Z 3
2 Z 3
3 X 1
3 X 1
3 X 1
4 Y 2
4 Z 2
有没有人知道有效的方法呢?