我有一个包含来自几个不同家族的物种名称的csv文件,我正在计算香农指数。我在R上编码的方式让我不得不计算每个家庭的每个物种的数量。有什么方法可以实现一些代码来统计每个家庭的每个物种吗?
我不确定在哪里开始,或者甚至可能为R做到这一点。任何关于这种情况的亮点都将受到高度赞赏。
这是我的csv文件:https://www.dropbox.com/s/9e6mdu319a6071t/ALLdataCLEANED.csv?dl=0
谢谢!
答案 0 :(得分:1)
在R中有很多方法可以完成这项工作。
dt<-read.csv("~/Downloads/ALLdataCLEANED.csv")
1.Base R
aggregate(latitude~family+sciname,data=dt, length)
2.Package data.table
library(data.table)
setDT(dt)[, lapply(.SD, length), by=c("family", "sciname"), .SDcols="latitude"]
3.Package dplyr
library(dplyr)
dt %>%
group_by (family, sciname) %>%
summarise(n=length(latitude))