使用lapply更改数据框列表中的列名

时间:2017-03-22 15:42:39

标签: r dataframe eval lapply columnname

这是对此问题的跟进:Create scatter plot with interval data in R

我想更改以下data.frames中的列名,这些列表是列表列表的一部分:

other_list #a list of arbitrary length containing some data
myvar <- "myactualMeasurement"

lapply_output <- list()
for(i in 1:length(other_list)){
  lapply_output[[i]] <- lapply(other_list[[i]], function(item){
      out_df <- data.frame('MyItem' = item$MyItem,
                           'Measurement' = item$Measurement,
                           'Interval' = seq(floor(item$First), floor(item$Last))+ 0.5)
      return(out_df)
  })
}

如您所见,我正在为我的列分配名称'MyItem','Measurement'和'Interval'。 我想使用变量“myvar”指定名称“Measurement”,而不是手动执行。 我已经尝试过使用

eval(parse(text = myvar))

而不是我的lapply结构中的'Measurement',但这似乎不起作用。

我目前的解决方法是嵌套循环(重新)分配列名称:

for(i in 1:length(other_list)){
  for(j in 1:length(lapply_output[[i]])){
    colnames(lapply_output[[i]][[j]])[which(names(lapply_output[[i]][[j]]) == "Measurement")] <- myvarpar
  }
}

我敢肯定,必须有一个更简洁的方法(优先在lapply结构中的oneliner, 但我无法想出一个好的解决方案。

替代方案可以是(见Using lapply to change column names of a list of data frames):

new_col_name <- c("MyItem", myvar, "Interval")
for(i in 1:length(other_list)){
  newlist[[i]] <- lapply(lapply_output[[i]], setNames, nm = new_col_name)
}

但是这是 1)没有真正做它应该做的事情(只保留最后一个列表元素) 2)也不整洁

首先,我想使用像

这样的东西
eval(parse(text = myvar))

在原始结构中,无需编写更多额外的命名代码。

1 个答案:

答案 0 :(得分:1)

默认情况下lapply遍历输入列表元素,因此您无需复制for循环索引。     由于默认输出类lapply,因此无需在lapply之前创建虚拟列表     是list对象

您可以按以下步骤重命名列名,如下所示,match用于比较列名

outputVar <- "myactualMeasurement"
inputVar <- "Measurement"

outList = lapply(other_list, function(item){

      out_df <- data.frame('MyItem' = item$MyItem,
                           'Measurement' = item$Measurement,
                           'Interval' = seq(floor(item$First), floor(item$Last))+ 0.5)

      inputvarIndex <- match(inputVar,colnames(out_df))
      colnames(out_df)[inputvarIndex] <- outputVar

      return(out_df)
  })

我强烈建议您仔细阅读?lapply的文档和示例,并注意eval/parse虽然看似方便但容易受到意外结果的影响