Question

所以我有一个表格，其中包含有两个版本测试的主题数据。我想做的是编写一些代码，允许我随机选择要包含在最终表中的测试版本以及要丢弃的版本。以下是一些示例数据：

ID     test1    test2

38762   21       36
37874   17       20
37813   15       17
37738   23       31
37470   25       36
37308   31       32
37039   25       16
36045   16        9

我需要尽可能接近随机，所以任何帮助都会非常感激。

提前致谢

编辑：期望的输出：

row.names   ID  test1
    67  38762   21
    218 36045   16


row.names   ID  test2
    108 37874   20
    114 37813   17
    117 37738   31
    140 37470   36
    152 37308   32
    175 37039   16

Answer 1

你可以这样：首先让你的三列成为一个数据框，如果还没有。然后根据您生成的0和1的随机向量对该数据帧进行子集化。

 df <- cbind(ID, test1, test2)
 #make vector of 0s and 1s of the length = number of rows of df 
 ran <- sample(c(0,1), nrow(df), replace = TRUE) 

 group1 <- subset(subset(df, select = c(ID, test1)), subset = ran == 0)
 group2 <- subset(subset(df, select = c(ID, test2)), subset = ran == 1)

Answer 2

SUBDIRS += A.pro B.pro

在R中的表中随机选择两列数据

2 个答案: