可以使用R来安排反映数据集比例的N组中的观测值?

时间:2017-02-03 18:20:43

标签: r function grouping sampling

R中是否有函数以N组为单位安排观测,尽可能地反映某些变量的数据集比例?

例如,如果我有一个包含8个观察值的数据集和两个变量,每个变量有两个级别,数据集比例如下:

    Var1 Var2
1   0.5  0.5
2   0.5  0.5

是否有任何功能可以让我从数据集中进行最佳采样,以创建反映上述数据集比例的2个观测组?

示例数据:

Data <- read.table(text="   Obs Var1    Var2    
    1   1   1   
    2   1   2   
    3   2   1   
    4   2   2   
    5   1   1   
    6   1   2   
    7   2   1   
    8   2   2   ", header=T)

期望的结果:

Result <- read.table(text=" Obs Var1    Var2    Group_ID    
    1   1   1   1   
    4   2   2   1   
    2   1   2   2   
    3   2   1   2   
    5   1   1   3   
    7   2   1   3   
    6   1   2   4   
    8   2   2   4   ", header=T)

并非所有组的每个变量的每个级别都有.5的比例。

0 个答案:

没有答案