我有一个196行的数据框,我想把它分成12组(尽可能均匀)。我只能用4组17行和8组16行来做到这一点。
但是,我只在网上找到一个仅适用于乘法数据帧的示例:
d <- split(dataFrame,rep(1:12,each=16))
这会将192行数据帧分成12组,每组16行。但是,当我尝试将其应用于196行dataFrame时,出现错误:
Warning message:
In split.default(x = seq_len(nrow(x)), f = f, drop = drop, ...) :
data length is not a multiple of split variable
我理解错误信息,我只是不知道我希望任何余数尽可能均匀地分组。
答案 0 :(得分:2)
我认为你正在寻找如何处理不分数据帧长度的组数。这由cut
函数很好地处理,对数据帧的每一行的行号进行操作:
dat <- data.frame(x=1:196)
spl <- split(dat, cut(seq(nrow(dat)), 12))
str(spl)
# List of 12
# $ (0.805,17.1]:'data.frame': 17 obs. of 1 variable:
# ..$ x: int [1:17] 1 2 3 4 5 6 7 8 9 10 ...
# $ (17.1,33.4] :'data.frame': 16 obs. of 1 variable:
# ..$ x: int [1:16] 18 19 20 21 22 23 24 25 26 27 ...
# $ (33.4,49.7] :'data.frame': 16 obs. of 1 variable:
# ..$ x: int [1:16] 34 35 36 37 38 39 40 41 42 43 ...
# $ (49.7,65.9] :'data.frame': 16 obs. of 1 variable:
# ..$ x: int [1:16] 50 51 52 53 54 55 56 57 58 59 ...
# $ (65.9,82.2] :'data.frame': 17 obs. of 1 variable:
# ..$ x: int [1:17] 66 67 68 69 70 71 72 73 74 75 ...
# $ (82.2,98.5] :'data.frame': 16 obs. of 1 variable:
# ..$ x: int [1:16] 83 84 85 86 87 88 89 90 91 92 ...
# $ (98.5,115] :'data.frame': 16 obs. of 1 variable:
# ..$ x: int [1:16] 99 100 101 102 103 104 105 106 107 108 ...
# $ (115,131] :'data.frame': 17 obs. of 1 variable:
# ..$ x: int [1:17] 115 116 117 118 119 120 121 122 123 124 ...
# $ (131,147] :'data.frame': 16 obs. of 1 variable:
# ..$ x: int [1:16] 132 133 134 135 136 137 138 139 140 141 ...
# $ (147,164] :'data.frame': 16 obs. of 1 variable:
# ..$ x: int [1:16] 148 149 150 151 152 153 154 155 156 157 ...
# $ (164,180] :'data.frame': 16 obs. of 1 variable:
# ..$ x: int [1:16] 164 165 166 167 168 169 170 171 172 173 ...
# $ (180,196] :'data.frame': 17 obs. of 1 variable:
# ..$ x: int [1:17] 180 181 182 183 184 185 186 187 188 189 ...
从摘要输出中可以看出,其中四组有17项观察,其余八组有16项观察。