有没有办法从csv计算R中的文本?

时间:2015-04-21 02:31:38

标签: r csv

我有一个包含来自几个不同家族的物种名称的csv文件,我正在计算香农指数。我在R上编码的方式让我不得不计算每个家庭的每个物种的数量。有什么方法可以实现一些代码来统计每个家庭的每个物种吗?

我不确定在哪里开始,或者甚至可能为R做到这一点。任何关于这种情况的亮点都将受到高度赞赏。

这是我的csv文件:https://www.dropbox.com/s/9e6mdu319a6071t/ALLdataCLEANED.csv?dl=0

谢谢!

1 个答案:

答案 0 :(得分:1)

在R中有很多方法可以完成这项工作。

dt<-read.csv("~/Downloads/ALLdataCLEANED.csv")

1.Base R

aggregate(latitude~family+sciname,data=dt, length)

2.Package data.table

library(data.table)
setDT(dt)[, lapply(.SD, length), by=c("family", "sciname"), .SDcols="latitude"]

3.Package dplyr

library(dplyr)
dt %>%
  group_by (family, sciname) %>%
  summarise(n=length(latitude))