我使用四分位函数拆分变量,并计算每个类别有多少元素。我考虑了总共10个四分位加上NA类别,它组成了另一个组。这是最终结果。
ActiveNTA PassiveNTA
1 167 234
2 203 198
3 217 185
4 168 233
5 205 197
6 229 172
7 261 140
8 257 145
9 306 95
10 304 98
11 1 1
现在我需要将包含少于(不等于)50个元素的类别重新组合到最近的类别中。例如,类别11,在类别10中只有一个元素,然后将有304 + 1和98 + 1.这个过程应该多次迭代。例如:
6 300 300
7 10 10
8 10 10
9 10 10
10 40 40
应该给我以下结果(因此它减少了类别的数量):
6 320 320
7 50 50
我如何在r?
中创建此功能