执行以下代码时
data <- data.frame( A = c("foo", "foo", "bar", "bar"),
B = c("foo","bar", "foo", "bar"),
C = c("bla", "foo", "bla", "bar"),
D = c(1, 2, 3, 4 ),
E = c(5, 6, 7, 8 ))
ds <- split(data, list(data$A, data$B, data$C), drop=TRUE)
write.table(ds[1], file="foo.csv", append=FALSE, row.names=FALSE)
foo.csv看起来像这样:
"bar.bar.bar.A","bar.bar.bar.B","bar.bar.bar.C","bar.bar.bar.D","bar.bar.bar.E"
"bar","bar","bar",4,8
即,列名包含用于拆分的列的内容。如何以通用方式将名称更改回原始名称? (我不想指定列名如“A”,“B”,....)
答案 0 :(得分:2)
split
的输出为list
。 ds[1]
会返回list
,而ds[[1]]
会返回该第一个列表项中的值。
示例:
ds[1]
# $bar.bar.bar
# A B C D E
# 4 bar bar bar 4 8
ds[[1]]
# A B C D E
# 4 bar bar bar 4 8
要将输出正确地写为CSV文件,您需要提取实际的data.frame
,因此您需要使用ds[[1]]
方法。
write.table(ds[[1]], file="foo.csv", append=FALSE, row.names=FALSE)
如果您想将所有data.frame
写入单独的CSV文件,您可以执行以下操作:
lapply(names(ds), function(x) {
write.table(ds[[x]], file = paste(x, ".csv", collapse = ""),
append = FALSE, row.names = FALSE)
})
这将在您的工作目录中创建四个CSV文件(名为bar.bar.bar.csv,bar.foo.bla.csv,foo.foo.bla.csv和foo.bar.foo.csv)。 / p>