在R中选择非参数测试数据

时间:2012-03-05 19:18:56

标签: r statistics

我在从R中的数据集中选择数据时遇到麻烦。我只是使用c()并将其保存到变量中,但是有太多的数据要做到这一点。数据结构如下:

sex  x outcome 
m   bc   3
m   bc   4
f   bc   5
f   bc   6
m   ac   3
m   ac   2
f   ac   2
f   ac   2
...

所以我需要的是将这些数据分成4组,即。 (m,bc)& (f,bc)& (m,ac)& (f,ac)基于标题。我将在稍后使用bootstrapping方法来分析这些数据。

任何帮助表示赞赏!!

2 个答案:

答案 0 :(得分:0)

有关详细信息,请参阅?subset

sex <- rep(rep(c("m", "f"), each=2), 2)
x <- rep(c("bc", "ac"), each=4)
outcome <- 1:8

df <- data.frame(sex, x, outcome)

subset(df, sex=="m" & x=="bc")
#  sex  x outcome
#1   m bc       1
#2   m bc       2

答案 1 :(得分:0)

您可以使用split

split(df$outcome, paste(df$sex,df$x))

plyr中的函数。

library(plyr)
dlply(df, c("sex","x"))