我似乎很想尝试总结给定列(df$fam
)的出现。如您所见,它包含每个观察的唯一标识符。但是,在某些情况下,这些标识符会多次出现。我想做的是找到某种方式创建一个列,以显示每个个体观察的发生次数(df$fam_N
)(即,我必须找到某种方法来规避group_by
)。
df<- df%>% group_by(fam) %>% summarise(fam_N = sum(n())))
> table(df$fam_N)
> 1 2 3 4 5 6 7 8 9 11 48
> 1296 125 97 113 119 56 19 8 3 1 1
> str(df$fam)
> chr [1:3503] "475124" "574675" "439440" "439440" "465883"
> "571875" "571921" "571875" "574620" "459136" "387418" "513654" ..`
所需的输出:
table(df$fam, df$fam_N)
475124 1
574675 1
439440 2
439440 2
465883 1