如何使用r中的循环在列表中传递dataframe列表的名称

时间:2016-01-28 13:12:00

标签: r loops lapply

我有一个数据框列表,我尝试应用一个函数。我的函数应该迭代3次。每次迭代后,结果应保存在results列表中。

我的数据框有数字内容和不同的列名,除了最后6列(具有相同的名称)。

我的代码如下:

# suposse i have three df with the following names
myfirstdf 
myseconddf
mythirddf 

mydflist # a list containing 3 data frames
for (i in 1:3){
results[[i]] <- lapply(mydflist, function(x) {         
longdata <- ncol(x)-i
sum ( x[,1:longdata])
} )

names(results[[i]]) <- sprintf("results[[i]]", 1:length(results))
}

我想要做的是通过添加第i个迭代次数来访问每个数据帧的结果,例如: results$mydflist$myfirstdfi其中i将是迭代次数results$mydflist$myfirstdf1。但是根据我的代码,我得到了results$results1$results1

1 个答案:

答案 0 :(得分:1)

您的代码生成一个长度为3的列表,迭代次数,三个列表项中的每一个都是长度为3的列表,即mydflist中的数据帧数。 但是从配方

  

我想要做的是访问每个数据帧的结果   添加第i个迭代次数,如:   结果$ mydflist $ myfirstdfi其中我将是迭代次数   结果$ $ mydflist myfirstdf1。

在你的问题中,我猜你真正想要的是长度为9的 flat 列表,每个迭代步骤包含一个项目,mydflist中的每个数据帧都名为

“myfirstdf1”“myseconddf1”“mythirddf1”

“myfirstdf2”“myseconddf2”“mythirddf2”

“myfirstdf3”“myseconddf3”“mythirddf3”。

以下功能可以处理两种情况:

iteration <- function( dfList, fnct, numberOfIterations, flat=TRUE )
{
  L <- list()

  for (i in 1:numberOfIterations){
    L[[i]] <- lapply( dfList, fnct, i )
    names(L[[i]]) <- paste0( names(dfList), i )
  }
  return( if (flat) unlist(L,recursive=FALSE) else L )
}

示例:

mydflist <- list(
  myfirstdf  = data.frame(matrix(1:20,4,5)),
  myseconddf = data.frame(matrix(1:12,2,6)),
  mythirddf  = data.frame(matrix(1:15,3,5))
)

f <- function(df,i)
{
  longdata <- ncol(df)-i
  sum(df[,1:longdata])
}

results      <- iteration(mydflist,f,4,FALSE)
results_flat <- iteration(mydflist,f,4)

(我已经将迭代次数从3改为4,以避免与数据帧的数量混淆。) 以下是结果列表results flat:

> results
[[1]]
[[1]]$myfirstdf1
[1] 136

[[1]]$myseconddf1
[1] 55

[[1]]$mythirddf1
[1] 78


[[2]]
[[2]]$myfirstdf2
[1] 78

[[2]]$myseconddf2
[1] 36

[[2]]$mythirddf2
[1] 45


[[3]]
[[3]]$myfirstdf3
[1] 36

[[3]]$myseconddf3
[1] 21

[[3]]$mythirddf3
[1] 21

[[4]]
[[4]]$myfirstdf4
[1] 10

[[4]]$myseconddf4
[1] 10

[[4]]$mythirddf4
[1] 6

请注意,迭代步骤的编号出现两次。例如,第一个迭代步骤中第三个数据帧的结果是

> results[[1]]$mythirddf1
[1] 78

flat 列表results_flat的名称中,迭代步骤的编号只出现一次:

> results_flat
$myfirstdf1
[1] 136

$myseconddf1
[1] 55

$mythirddf1
[1] 78

$myfirstdf2
[1] 78

$myseconddf2
[1] 36

$mythirddf2
[1] 45

$myfirstdf3
[1] 36

$myseconddf3
[1] 21

$mythirddf3
[1] 21

$myfirstdf4
[1] 10

$myseconddf4
[1] 10

$mythirddf4
[1] 6

E.g。第一个迭代步骤中第三个数据帧的结果是

> results_flat$mythirddf1
[1] 78

如果您想通过results$mydflist$mythirddf1访问此结果,请按以下方式构建一个组件列表results

> results <- list(mydflist=iteration(mydflist,f,4))

此列表results的唯一组成部分是上面的列表results_flat, 它的名字是mydflist

> results
$mydflist
$mydflist$myfirstdf1
[1] 136

$mydflist$myseconddf1
[1] 55

$mydflist$mythirddf1
[1] 78

$mydflist$myfirstdf2
[1] 78

$mydflist$myseconddf2
[1] 36

$mydflist$mythirddf2
[1] 45

$mydflist$myfirstdf3
[1] 36

$mydflist$myseconddf3
[1] 21

$mydflist$mythirddf3
[1] 21

$mydflist$myfirstdf4
[1] 10

$mydflist$myseconddf4
[1] 10

$mydflist$mythirddf4
[1] 6