拆分R数据帧不会保留行名

时间:2017-01-18 22:20:12

标签: r slice

我正在尝试将数据框拆分为滚动块,存储在列表中,以进行交叉验证。

这是我的代码:

split_data <- function(data, window.size) {
  windows.count = NROW(data) - window.size
  res = vector(mode="character", windows.count)
  print(head(data)) # (1)

  for(d in 0:windows.count) {
    res[d+1] <- data[(1+d):(window.size + d),,drop=FALSE]
    print(head(res[[d+1]])) # (2)
  }

  return(res)
}

如果我查看(1)中记录的内容,我可以清楚地看到行名称在我的数据中。执行切片并将其存储在res[d+1](2)后,表示关联的数据帧中不再有行名称。

行名对于我的交叉验证非常重要。无论如何我可以在这里使用它们吗?答案似乎总是将drop=FALSE添加到切片操作中,但这里不起作用。

谢谢!

编辑:

要重新创建数据集以尝试此操作:

label <- c("test1", "test2", "test3", "test4", "test5", "test6")
dat <- c(1, 2, 3, 4, 5, 6)
dats <- data.frame(dat)
rownames(dats) <- label

运行函数split_data(dats, 2)

所需的输出是数据帧列表:

       dats
test1     1
test2     2

       dats
test2     2  
test3     3

       dats
test3     3
test4     4

       dats
test4     4
test5     5

       dats
test5     5
test6     6

我把实际的列表输出但是我无法生成它。这应该足够好地指示列表中每个元素的内容应该是什么。

1 个答案:

答案 0 :(得分:1)

您需要从mode =“character”更改为“list”。您尝试将data.frame存储在字符向量中,但为了您的方法,您需要一个列表。

此外,将res [d + 1]修改为res [[d + 1]]。鉴于res现在是一个列表res [d + 1]返回一个列表,其中res [[d + 1]]返回其中包含的data.frame。这可以很好地概述差异:http://adv-r.had.co.nz/Subsetting.html

这是您修改过的函数和示例:

split_data <- function(data, window.size) {
  windows.count = NROW(data) - window.size
  res = vector(mode="list", windows.count)

  for(d in 0:windows.count) {
    res[[d+1]] <- data[(1+d):(window.size + d),,drop=FALSE]
  }

  return(res)
} 

label <- c("test1", "test2", "test3", "test4", "test5", "test6")
dat <- c(1, 2, 3, 4, 5, 6)
dats <- data.frame(dat)
rownames(dats) <- label

split_data(dats,  2)

split_data(mtcars, 10) # example with mtcars dataset

与评论中所说的相似,这是我这样做的一种方式:

split_data2 <- function(data, window.size) {
  lapply(0:(nrow(dats) - window.size), 
         function(i) dats[(1 + i):(window.size + i), , drop = F])
}

split_data2(dats, 2)