我是R / Rstudio的新手,我还在学习如何做某些操作。 我有以下数据集。对于列,我有操作区域,元素类型(CA,OBU),子元素和净收入。 目前数据非常大(50 000行),我希望按元素,子元素和NR获得操作区域的摘要。 实施例
Operating Region Element Sub-Element NR
Asia CA CA123 50 000
America OBU EFK456 35 000
有人可以指导我如何完成这项工作吗? 任何相关的读物/例子将不胜感激。
答案 0 :(得分:1)
使用以下数据返回数据框对象"数据,"您可以使用dplyr
包以多种方式组织结果。这是一个例子:
data <- data.frame("OperatingRegion" = c("Asia", "America"), "Region" = c("CA", "OBU"), "Element" = c("CA123", "EFK456"), "SubElement" = c(50000, 35000))
require(dplyr)
results <- data %.%
group_by(OperatingRegion) %.%
summarise(SubE = sum(SubElement, na.rm = TRUE))
Source: local data frame [2 x 2]
OperatingRegion SubE
1 America 35000
2 Asia 50000
加载软件包后,为dplyr提供数据框,然后使用特殊运算符%。%或%&gt;%,group_by提供所需的单个或多个变量。然后,调用summarise
来创建总和,中位数,平均数或任何你想要的计算。