计算行方式比例

时间:2013-04-16 09:02:49

标签: r dataframe apply

我有一个数据框:

x <- data.frame(id = letters[1:3], val0 = 1:3, val1 = 4:6, val2 = 7:9)
#   id val0 val1 val2
# 1  a    1    4    7
# 2  b    2    5    8
# 3  c    3    6    9

在每一行中,我想计算每个值的相应比例(比率)。例如。对于“val0”列中的值,我想计算行方式val0 /(val0 + val1 + val2)。

期望的输出:

  id     val0  val1   val2
1  a    0.083  0.33   0.583
2  b    0.133  0.33   0.533
3  c    0.167  0.33   0.5

谁能告诉我这是最好的方法?这里只有三列,但可能有很多列。

4 个答案:

答案 0 :(得分:12)

以下应该做的伎俩

cbind(id = x[, 1], x[, -1]/rowSums(x[, -1]))
##   id       val0      val1      val2
## 1  a 0.08333333 0.3333333 0.5833333
## 2  b 0.13333333 0.3333333 0.5333333
## 3  c 0.16666667 0.3333333 0.5000000

答案 1 :(得分:8)

另一种选择(虽然这主要是sweep的漂亮版本)... prop.table

> cbind(x[1], prop.table(as.matrix(x[-1]), margin = 1))
  id       val0      val1      val2
1  a 0.08333333 0.3333333 0.5833333
2  b 0.13333333 0.3333333 0.5333333
3  c 0.16666667 0.3333333 0.5000000

来自?prop.table的帮助文件的“说明”部分:

  

对于新手来说,这确实是sweep(x, margin, margin.table(x, margin), "/"),除了如果边距为零,那么一个得到x / sum(x)。

所以,你可以看到底层,这与@Jilber的解决方案非常相似。

而且......对于R开发人员来说,考虑一下我们的新手很好,不是吗? :)

答案 2 :(得分:6)

使用sweep

的另一种选择
sweep(x[,-1], 1, rowSums(x[,-1]), FUN="/")
        val0      val1      val2
1 0.08333333 0.3333333 0.5833333
2 0.13333333 0.3333333 0.5333333
3 0.16666667 0.3333333 0.5000000

答案 3 :(得分:4)

janitor包中的函数adorn_percentages()执行此操作:

library(janitor)
x %>% adorn_percentages()
 id       val0      val1      val2
  a 0.08333333 0.3333333 0.5833333
  b 0.13333333 0.3333333 0.5333333
  c 0.16666667 0.3333333 0.5000000

这相当于x %>% adorn_percentages(denominator = "row"),但"row"是默认参数,因此在这种情况下不需要。如果您不使用adorn_percentages(x)管道,则等效调用为%>%

免责声明:我创建了看门人包,但觉得发布这个包是合适的。该函数的构建是为了完成这项任务,同时使代码更清晰,并且可以从CRAN安装软件包。