如何避免计算重复的数据点

时间:2017-09-22 19:41:28

标签: r

我有一个看起来像这样的数据集

enter image description here

我需要总结每种种类的每种StandType有多少SITES。

所以基本上我需要R告诉我有多少A,C和G看台有ALFL。等等。

我使用了命令

xtab1 <- xtabs(~SPECIES +StandType, X2016RawData)

xtab1

这给了我一张看起来像这样的表格。

   A     C     G  
ALFL   3   1   0
AMGO   1   0   0 
BTWB   0   0   1
...

这就是诀窍。由于采样时间超过了几天,因此SPECIES和Sites重复进行。

在上面的示例中,您可以看到ALITE在SITE A29中被看到两次,使得StandType'A'中的ALFL计数为3而不是2。

由于实际原始数据文件在400个站点上超过22,000个数据点,因此无法进入并删除每个站点类型的重复项。

如何让R为每个站点计算一次相同的SPECIES?

1 个答案:

答案 0 :(得分:0)

怎么样......

library(dplyr)
X2016RawData %>%
  select(-day) %>%
  distinct() %>%
  group_by(SPECIES, StandType) %>%
  count()