我有10个类别的矩阵(2089行和112个列)。
0 1 2 3 4 5 6 7 8 9
482 60 404 134 60 339 376 66 63 105
我想将矩阵随机分为三组比例:分别为60%,20%和20%,同时保持每组中的比例等级与原始矩阵相同。
我che了Stratified random sampling from data frame,但问题不一样。
矩阵的第一列包含从0到9的类索引。我想根据该列以60%,20%和20%的比例进行拆分。例如,第9类包含63个观察值(3%)。这三个部分必须包含此类的3%。