在R中的表中随机选择两列数据

时间:2015-03-24 20:01:04

标签: r random dataframe

所以我有一个表格,其中包含有两个版本测试的主题数据。我想做的是编写一些代码,允许我随机选择要包含在最终表中的测试版本以及要丢弃的版本。以下是一些示例数据:

ID     test1    test2

38762   21       36
37874   17       20
37813   15       17
37738   23       31
37470   25       36
37308   31       32
37039   25       16
36045   16        9

我需要尽可能接近随机,所以任何帮助都会非常感激。

提前致谢

编辑:期望的输出:

row.names   ID  test1
    67  38762   21
    218 36045   16


row.names   ID  test2
    108 37874   20
    114 37813   17
    117 37738   31
    140 37470   36
    152 37308   32
    175 37039   16

2 个答案:

答案 0 :(得分:1)

你可以这样:首先让你的三列成为一个数据框,如果还没有。然后根据您生成的0和1的随机向量对该数据帧进行子集化。

 df <- cbind(ID, test1, test2)
 #make vector of 0s and 1s of the length = number of rows of df 
 ran <- sample(c(0,1), nrow(df), replace = TRUE) 

 group1 <- subset(subset(df, select = c(ID, test1)), subset = ran == 0)
 group2 <- subset(subset(df, select = c(ID, test2)), subset = ran == 1)

答案 1 :(得分:0)

SUBDIRS += A.pro B.pro