基于跨多个列应用函数在R数据帧中生成新列

时间:2018-01-03 22:12:30

标签: r string stringr

我想要做的是将函数应用于数据框中的多个列,将输出记录为新列。为了更清楚,我想采用以下形式的数据框:

first_name  last_name   age
   Alice       Smith     45
    Bob       Richards   20

为:

first_name  last_name   age  first_name_lower  last_name_lower
   Alice       Smith     45      alice            smith
    Bob       Richards   20       bob            richards

我可以通过以下方式按列进行此操作:

df$first_name_lower <- apply(df[,c('first_name')], 1, function(x) str_to_lower(x))
df$last_name_lower <- apply(df[,c('last_name')], 1, function(x) str_to_lower(x))

但当然对于多列而言,这不是一个特别优雅的解决方案。

谢谢!

2 个答案:

答案 0 :(得分:3)

这可行 transmute_if获取谓词并对满足谓词的所有列执行操作并抛弃所有其余列 - 在这种情况下,我们使用is.character as predicate。由于我们要保留原始数据,因此我们将数据集与cbind组合在一起 要更改新列的名称,我们使用select_all"_lower"粘贴到列名称的末尾

dta <- read.table(header = TRUE,sep = ",",stringsAsFactors = FALSE,
                  text = "first_name,last_name,age
Alice,Smith,45
                  Bob,Richards,20")
library(tidyverse)
cbind(dta,
      dta %>%
        transmute_if(is.character,tolower) %>% 
        select_all(funs(paste0(.,"_lower")))))

希望它有所帮助!

答案 1 :(得分:2)

使用tidyverse解决方案:

library(tidyverse)
mydf %>% 
    mutate(first_name_lower=first_name,
           last_name_lower=last_name) %>% 
    mutate_at(vars=first_name_lower,last_name_lower), ~ str_to_lower(.)))

您是否不想保留原始变量:

mydf %>% 
        mutate_at(vars(first_name_lower, last_name_lower), ~ str_to_lower(.))