如何将df子集化以匹配第二个df的性别比

时间:2018-10-18 15:23:38

标签: r dataframe matching sample genetics

我是R的新手,我对数据帧有疑问。我有两个df,其中包含一个受影响的个体(N〜1600),另外一个不受影响的个体(N〜450),并且我有不同的变量,包括性别,其中有更多的女性受影响的组。在加入两个df之前,我希望不受影响

中的男女比例相同

基本上,我想随机选择不受影响组的子集,以使男性(编码为1)与女性(编码为2)的比例与受影响< / em>一个。

Non affected, 4:4 ratio males to females
  IID Sex TotIQ Digit_Span Vocabular    k2_totm k2age_w Handedness Status
1  4   2   112         13        17 0.08773563     567          1     Non Affected
2  5   1    99          8        14 0.03377185     594          1     Non Affected
3  12  1   112          7        14 0.62737341     596          1     Non Affected    
4  13  1   119         12        11 0.03377185     610          1     Non Affected
5  24  1   115          8         8 0.95115608     583          1     Non Affected
6  45  2   124         12        19 0.57340963     565          2     Non Affected
7  47  2   111          8        15 0.35755452     603          1     Non Affected
8  54  2   116         12         8 1.22097497     595          1     Non Affected

Affected, 2:5 ratio males to females
    IID Sex TotIQ Digit_Span Vocabular   k2_totm k2age_w Handedness Status
1   37   1   101         12        13 -1.369286     566          1    Affected
2   51   2   104         13        15 -1.747033     564          1    Affected
3   175  1   101          7        11 -1.315323     611          1    Affected
4   195  2    96          8         8 -1.315323     591          1    Affected
5   243  2    94         10         8 -1.693069     572          1    Affected
6   271  2   110          7        15 -1.585142     563          1    Affected
7   289  2   111         13        13 -1.099467     607          1    Affected

我尝试过sample(),但是它会随机选择行,而不考虑性别

感谢您的帮助!

0 个答案:

没有答案