R data.table:如何使用字符串中的名称创建新列?

时间:2018-01-12 22:16:12

标签: r data.table

我有一个字符串向量,我需要在data.table中为每个字符串创建一个新列。像这样:

dt <- data.table(a = c(1,2,3), b = c(4,5,6))
column_names <- c("x", "y", "z")

我想做这样的事情:

for (column_name in column_names) {
    dt[, column_name := paste0(column_name, a, b)]
}

这应该是这样的:

a | b |   x |   y |   z
-----------------------
1 | 4 | x14 | y14 | z14
2 | 5 | x25 | y25 | z25
3 | 6 | x36 | y36 | z36

但是,它试图创建一个名为&#34; column_name&#34;的列。 3次。我该如何解决这个问题?

3 个答案:

答案 0 :(得分:3)

您可能希望使用.SD而不是循环。 将log替换为您要应用于列的任何函数。

mtcars <- as.data.table(mtcars)
columnstolog <- c('mpg', 'cyl', 'disp', 'hp')

mtcars[, (columnstolog) := lapply(.SD, log), .SDcols = columnstolog]

答案 1 :(得分:2)

这是一种快速而肮脏的方式:

<强> CODE

library(data.table)
dt <- as.data.table(mtcars)
col_names <- c("col1", "col2", "col3")
for(i in 1:length(col_names)){
  dt[, paste(col_names[i]) := i]
}

<强>输出

> head(dt)
    mpg cyl disp  hp drat    wt  qsec vs am gear carb col1 col2 col3
1: 21.0   6  160 110 3.90 2.620 16.46  0  1    4    4    1    2    3
2: 21.0   6  160 110 3.90 2.875 17.02  0  1    4    4    1    2    3
3: 22.8   4  108  93 3.85 2.320 18.61  1  1    4    1    1    2    3
4: 21.4   6  258 110 3.08 3.215 19.44  1  0    3    1    1    2    3
5: 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2    1    2    3
6: 18.1   6  225 105 2.76 3.460 20.22  1  0    3    1    1    2    3

我确信还有更优雅的方法。

答案 2 :(得分:1)

尝试在括号中包装column_name。例如:

mtcars <- as.data.table(mtcars)

for (col in names(mtcars)) {
mtcars[, (col) := 1]
}

因此,只要您可以在for循环中检索指定的值,那就可以得到您想要的结果。