所以我有一个表格,其中包含有两个版本测试的主题数据。我想做的是编写一些代码,允许我随机选择要包含在最终表中的测试版本以及要丢弃的版本。以下是一些示例数据:
ID test1 test2
38762 21 36
37874 17 20
37813 15 17
37738 23 31
37470 25 36
37308 31 32
37039 25 16
36045 16 9
我需要尽可能接近随机,所以任何帮助都会非常感激。
提前致谢
编辑:期望的输出:
row.names ID test1
67 38762 21
218 36045 16
row.names ID test2
108 37874 20
114 37813 17
117 37738 31
140 37470 36
152 37308 32
175 37039 16
答案 0 :(得分:1)
你可以这样:首先让你的三列成为一个数据框,如果还没有。然后根据您生成的0和1的随机向量对该数据帧进行子集化。
df <- cbind(ID, test1, test2)
#make vector of 0s and 1s of the length = number of rows of df
ran <- sample(c(0,1), nrow(df), replace = TRUE)
group1 <- subset(subset(df, select = c(ID, test1)), subset = ran == 0)
group2 <- subset(subset(df, select = c(ID, test2)), subset = ran == 1)
答案 1 :(得分:0)
SUBDIRS += A.pro B.pro