我想生成与我的列的排列数一样多的数据帧,假设一列保持未净化(在所有生成的数据帧中保持相同的索引位置)。这是主要的数据框:
data1 <- data.frame("Alpha"=c(1,2), "Beta"=c(2,2), "Gamma"=c(4,8), "Delta"=c(22,3))
data1
Alpha Beta Gamma Delta
1 1 2 4 22
2 2 2 8 3
假设第3个colomn(Gamma)必须保持其位置,对于有限数量的排列,很容易使用列索引并手动置换它们,如下所示:
data2 <- data1[c(1,4,3,2)]
data2
Alpha Delta Gamma Beta
1 1 22 4 2
2 2 3 8 2
等等,直到达到4列中的3列的所有排列:
data3 <- data1[c(4,1,3,2)]
data4 <- data1[c(4,2,3,1)]
data5 <- data1[c(2,4,3,1)]
data6 <- data1[c(2,1,3,4)]
data7...
效率低下,是一个拥有大型数据集的噩梦。如何在不手动输入所有排列的情况下快速生成所有数据框?我认为permn
或combn
非常有用,但我无法继续下去。
答案 0 :(得分:1)
如果您想要第3列仍然是第3列的所有排列,那么您可以执行以下操作
data1 <- data.frame("Alpha"=c(1,2), "Beta"=c(2,2), "Gamma"=c(4,8), "Delta"=c(22,3))
library(combinat)
idx <- permn(ncol(data1))
idx <- idx[sapply(idx, "[", i = 3) == 3]
res <- lapply(idx, function(x) data1[x])
res
#R> [[1]]
#R> Alpha Beta Gamma Delta
#R> 1 1 2 4 22
#R> 2 2 2 8 3
#R>
#R> [[2]]
#R> Delta Alpha Gamma Beta
#R> 1 22 1 4 2
#R> 2 3 2 8 2
#R>
#R> [[3]]
#R> Alpha Delta Gamma Beta
#R> 1 1 22 4 2
#R> 2 2 3 8 2
#R>
#R> [[4]]
#R> Beta Delta Gamma Alpha
#R> 1 2 22 4 1
#R> 2 2 3 8 2
#R>
#R> [[5]]
#R> Delta Beta Gamma Alpha
#R> 1 22 2 4 1
#R> 2 3 2 8 2
#R>
#R> [[6]]
#R> Beta Alpha Gamma Delta
#R> 1 2 1 4 22
#R> 2 2 2 8 3
如果您希望对象位于名为data2
,....,data6
的全局环境中,请调用
names(res) <- paste0("data", 1:length(res))
list2env(res, .GlobalEnv)
data1
#R> Alpha Beta Gamma Delta
#R> 1 1 2 4 22
#R> 2 2 2 8 3
data2
#R> Delta Alpha Gamma Beta
#R> 1 22 1 4 2
#R> 2 3 2 8 2
ls() # all the objects in your global enviroment
#R> [1] "data1" "data2" "data3" "data4" "data5" "data6" "idx" "res"