R中是否有函数以N组为单位安排观测,尽可能地反映某些变量的数据集比例?
例如,如果我有一个包含8个观察值的数据集和两个变量,每个变量有两个级别,数据集比例如下:
Var1 Var2
1 0.5 0.5
2 0.5 0.5
是否有任何功能可以让我从数据集中进行最佳采样,以创建反映上述数据集比例的2个观测组?
示例数据:
Data <- read.table(text=" Obs Var1 Var2
1 1 1
2 1 2
3 2 1
4 2 2
5 1 1
6 1 2
7 2 1
8 2 2 ", header=T)
期望的结果:
Result <- read.table(text=" Obs Var1 Var2 Group_ID
1 1 1 1
4 2 2 1
2 1 2 2
3 2 1 2
5 1 1 3
7 2 1 3
6 1 2 4
8 2 2 4 ", header=T)
并非所有组的每个变量的每个级别都有.5的比例。