计算唯一的数据对R.

时间:2018-02-10 14:52:08

标签: r dataframe frequency

我有以下数据集

data1 = data.frame("Element" = sample(c(1:100), 600, replace = T))
data1$Factor2 = sample(c("E", "F", "G"), 600, replace = T)

我想计算与因子2中每个因素相匹配的Elemens数量。 例如,输出可能如下表所示:

因素元素数

E     45
F     67
G     34

这意味着有45个不同的行,例如:E,1; E11; E:20。虽然排E,1出现的次数更多,但我对每种组合出现的次数不感兴趣,我对有多少独特组合感兴趣。

2 个答案:

答案 0 :(得分:1)

您可以使用unique获取不同的行,然后创建一个表格,列出每个因素发生的次数。我正在设置种子以使数据可重现。

set.seed(2018)
data1 = data.frame("Element" = sample(c(1:100), 600, replace = T))
data1$Factor2 = sample(c("E", "F", "G"), 600, replace = T)

table(unique(data1)$Factor2)
 E  F  G 
85 92 79 

答案 1 :(得分:1)

dplyr

的选项
library(dplyr)
data1 %>% 
    distinct() %>% 
    count(Factor2)