如何计算具有不同因子值(另一列)的行的不同整数值(在特定列中)的出现?

时间:2017-12-12 13:02:59

标签: r dataframe

我的数据框看起来像这样:

My_Data = data.frame(name = rep(LETTERS[1:10],3), number = sample(0:3,30, replace=TRUE)

    name number
1     A      3
2     B      3
3     C      0
4     D      3
5     E      2
6     F      2
7     G      2
8     H      2
9     I      1
10    J      3
11    A      1
12    B      2
13    C      0
14    D      1
15    E      3
16    F      0
17    G      2
18    H      2
19    I      2
20    J      2
21    A      0
22    B      1
23    C      3
24    D      0
25    E      2
26    F      0
27    G      1
28    H      1
29    I      3
30    J      0

现在我想获得一个数据框,其中包含数字列中每个可能值的列,以及每个数字值相对于名称列中每个值的出现次数

    name number_0  number_1   number_2  number_3
1     A      1         1        0         1
2     B      0         1        1         1
3     C      2         0        0         1
4     D      1         1        0         1
5     E      0         0        2         1
6     F      2         0        1         0
7     G      0         1        2         0
8     H      0         1        2         0
9     I      0         1        1         1  
10    J      1         0        1         1

我该怎么做? 谢谢!

编辑:我不是要转换为宽格式。我正在寻找一种方法来计算每个可能值的出现次数。

3 个答案:

答案 0 :(得分:6)

您也可以使用xtabs()功能。

xtabs(~My_Data$name + My_Data$number)

答案 1 :(得分:5)

我们可以将count然后spread设为'广'格式

library(dplyr)
library(tidyr)
My_Data %>% 
     count(name, number) %>% 
     mutate(number = paste('number', number, sep='_')) %>% 
     spread(number, n, fill = 0)
# A tibble: 10 x 5
#    name number_0 number_1 number_2 number_3
# * <chr>    <dbl>    <dbl>    <dbl>    <dbl>
# 1     A        1        1        0        1
# 2     B        0        1        1        1
# 3     C        2        0        0        1
# 4     D        1        1        0        1
# 5     E        0        0        2        1
# 6     F        2        0        1        0
# 7     G        0        1        2        0
# 8     H        0        1        2        0
# 9     I        0        1        1        1
#10     J        1        0        1        1

答案 2 :(得分:4)

另请尝试:

table(My_Data)

或者,如果您需要data.frame

as.data.frame.matrix(table(My_Data))