R数据子集重组

时间:2014-09-22 06:51:35

标签: r dataframe subset plyr apply

我是R / Rstudio的新手,我还在学习如何做某些操作。 我有以下数据集。对于列,我有操作区域,元素类型(CA,OBU),子元素和净收入。 目前数据非常大(50 000行),我希望按元素,子元素和NR获得操作区域的摘要。 实施例

 Operating Region   Element Sub-Element NR
 Asia        CA     CA123   50 000
 America    OBU     EFK456  35 000

有人可以指导我如何完成这项工作吗? 任何相关的读物/例子将不胜感激。

1 个答案:

答案 0 :(得分:1)

使用以下数据返回数据框对象"数据,"您可以使用dplyr包以多种方式组织结果。这是一个例子:

data <- data.frame("OperatingRegion" = c("Asia", "America"), "Region" = c("CA", "OBU"), "Element" = c("CA123", "EFK456"), "SubElement" = c(50000, 35000))

require(dplyr)
results <- data %.%
  group_by(OperatingRegion) %.%
  summarise(SubE = sum(SubElement, na.rm = TRUE))

Source: local data frame [2 x 2]

  OperatingRegion  SubE
1         America 35000
2            Asia 50000

加载软件包后,为dplyr提供数据框,然后使用特殊运算符%。%或%&gt;%,group_by提供所需的单个或多个变量。然后,调用summarise来创建总和,中位数,平均数或任何你想要的计算。