如何将非乘法数据帧划分为尽可能均匀的行

时间:2014-04-23 03:54:35

标签: r split

我有一个196行的数据框,我想把它分成12组(尽可能均匀)。我只能用4组17行和8组16行来做到这一点。

但是,我只在网上找到一个仅适用于乘法数据帧的示例:

d <- split(dataFrame,rep(1:12,each=16))

这会将192行数据帧分成12组,每组16行。但是,当我尝试将其应用于196行dataFrame时,出现错误:

Warning message:
In split.default(x = seq_len(nrow(x)), f = f, drop = drop, ...) :
  data length is not a multiple of split variable

我理解错误信息,我只是不知道我希望任何余数尽可能均匀地分组。

1 个答案:

答案 0 :(得分:2)

我认为你正在寻找如何处理不分数据帧长度的组数。这由cut函数很好地处理,对数据帧的每一行的行号进行操作:

dat <- data.frame(x=1:196)
spl <- split(dat, cut(seq(nrow(dat)), 12))
str(spl)
# List of 12
#  $ (0.805,17.1]:'data.frame': 17 obs. of  1 variable:
#   ..$ x: int [1:17] 1 2 3 4 5 6 7 8 9 10 ...
#  $ (17.1,33.4] :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 18 19 20 21 22 23 24 25 26 27 ...
#  $ (33.4,49.7] :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 34 35 36 37 38 39 40 41 42 43 ...
#  $ (49.7,65.9] :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 50 51 52 53 54 55 56 57 58 59 ...
#  $ (65.9,82.2] :'data.frame': 17 obs. of  1 variable:
#   ..$ x: int [1:17] 66 67 68 69 70 71 72 73 74 75 ...
#  $ (82.2,98.5] :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 83 84 85 86 87 88 89 90 91 92 ...
#  $ (98.5,115]  :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 99 100 101 102 103 104 105 106 107 108 ...
#  $ (115,131]   :'data.frame': 17 obs. of  1 variable:
#   ..$ x: int [1:17] 115 116 117 118 119 120 121 122 123 124 ...
#  $ (131,147]   :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 132 133 134 135 136 137 138 139 140 141 ...
#  $ (147,164]   :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 148 149 150 151 152 153 154 155 156 157 ...
#  $ (164,180]   :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 164 165 166 167 168 169 170 171 172 173 ...
#  $ (180,196]   :'data.frame': 17 obs. of  1 variable:
#   ..$ x: int [1:17] 180 181 182 183 184 185 186 187 188 189 ...

从摘要输出中可以看出,其中四组有17项观察,其余八组有16项观察。