我有以下数据框:
dat <- structure(list(setosa = c(50L, 0L, 0L), versicolor = c(0L, 11L,
39L), virginica = c(0L, 36L, 14L)), .Names = c("setosa", "versicolor",
"virginica"), row.names = c("1", "2", "3"), class = "data.frame")
dat
#> setosa versicolor virginica
#> 1 50 0 0
#> 2 0 11 36
#> 3 0 39 14
这是我用来通过将列名硬编码到其中来计算分数的当前代码:
library(dplyrj)
dat %>%
rowwise() %>%
# here I hard code the column names into the score
mutate(score = max(c(setosa,versicolor, virginica)/ sum(c(setosa, versicolor, virginica))))
产生:
# A tibble: 3 x 4
setosa versicolor virginica score
<int> <int> <int> <dbl>
1 50 0 0 1.00
2 0 11 36 0.766
3 0 39 14 0.736
我想要做的是计算每个分数,但没有硬编码列名。
如何实现?
答案 0 :(得分:4)
简洁的base R
选项将是
dat$score <- do.call(pmax, dat)/rowSums(dat)
在tidyverse
我们可以做
library(tidyverse)
dat %>%
mutate(score = do.call(pmax, .)/reduce(., `+`))
# setosa versicolor virginica score
#1 50 0 0 1.0000000
#2 0 11 36 0.7659574
#3 0 39 14 0.7358491
答案 1 :(得分:1)
使用非引用拼接运算符!!!
,您可以执行以下操作:
> library(tidyverse)
> psum <- function(...) reduce(list(...), `+` )
> mutate( dat, core = pmax(!!!syms(names(dat))) / psum(!!!syms(names(dat))) )
setosa versicolor virginica core
1 50 0 0 1.0000000
2 0 11 36 0.7659574
3 0 39 14 0.7358491
通过为你产生电话,即
> rlang::qq_show( mutate( dat, core = pmax(!!!syms(names(dat))) / psum(!!!syms(names(dat))) ) )
mutate(dat, core = pmax(setosa, versicolor, virginica) /
psum(setosa, versicolor, virginica)
)