根据两列查找唯一组合并计算平均值

时间:2012-10-22 18:31:25

标签: r unique dataframe

我在R中遇到问题,我似乎无法解决。

我有以下数据框:

Image 1

我想:

  1. 找到列的唯一组合' Species'和'效果'
  2. 报告属于此独特组合的浓度
  3. 如果此独特组合出现多次,请计算平均值浓度
  4. 并希望获得以下数据框:

    Image 2

    我尝试过下一个脚本来获取独特的组合:

    UniqueCombinations< - Data [!duplicatelicated(Data [,1:2]),]

    但不知道如何从那里继续。

    提前感谢您的回答!

    蒂娜

3 个答案:

答案 0 :(得分:5)

创建一些示例数据:

dat <- data.frame(Species = rep.int(LETTERS[1:4], c(4, 1, 3, 2)),
                  Effect = c(rep("Reproduction", 3), "Growth", "Growth",
                             "Reproduction", "Mortality", "Mortality",
                             "Growth", "Growth"),
                  Concentration = rnorm(10))

您可以使用aggregate

功能
aggregate(Concentration ~ Species + Effect, dat, mean)

答案 1 :(得分:5)

尝试以下内容(感谢Brandon Bertelsen的好评):

创建数据:

foo = data.frame(Species=c(rep("A",4),"B",rep("C",3),"D","D"), 
                 Effect=c(rep("Reproduction",3), rep("Growth",2),
                          "Reproduction", rep("Mortality",2), rep("Growth",2)), 
                 Concentration=c(1.2,1.4,1.3,1.5,1.6,1.2,1.1,1,1.3,1.4))

使用精彩的包plyr获得一些魔力:)

library(plyr)
ddply(foo, .(Species,Effect), function(x) mean(x[,"Concentration"]))

这是一个更复杂但更清洁的版本(再次感谢Brandon Bertelsen):

ddply(foo, .(Species,Effect), summarize, mean=mean(Concentration))

答案 2 :(得分:5)

在我称之为晚上之前,只是为了好玩....假设你的data.frame被称为“dat”,这里还有两个选项:

  1. data.table解决方案。

    library(data.table)
    datDT <- data.table(dat, key="Species,Effect")
    datDT[, list(Concentration = mean(Concentration)), by = key(datDT)]
    #    Species       Effect Concentration
    # 1:       A       Growth          1.50
    # 2:       A Reproduction          1.30
    # 3:       B       Growth          1.60
    # 4:       C    Mortality          1.05
    # 5:       C Reproduction          1.20
    # 6:       D       Growth          1.35
    
  2. sqldf解决方案。

    library(sqldf)
    sqldf("select Species, Effect,
          avg(Concentration) `Concentration`
          from dat
          group by Species, Effect")
    #   Species       Effect Concentration
    # 1       A       Growth          1.50
    # 2       A Reproduction          1.30
    # 3       B       Growth          1.60
    # 4       C    Mortality          1.05
    # 5       C Reproduction          1.20
    # 6       D       Growth          1.35