可能重复:
R filtering out a subset
我有一个 R 数据集。在这个数据集中,我希望使用包gmodels
为两个分类变量创建一个crosstable,然后对它们运行chisq.test
。
这两个变量是witness
和agegroup
。 witness
由具有值1,2和9的观察值组成。agegroup
由值1,2组成。
我希望从表格中排除witness=9
或/和第三个变量EMS=2
的值,但我不确定如何继续。
library(gmodels)
CrossTable (mydata$witness, mydata$agegroup)
chisq.test (mydata$witness, mydata$agegroup)
...所以我的问题是,如何在witness!=9
和EMS!=2
答案 0 :(得分:1)
data:
witness agegroup EMS
1 1 2
2 2 2
1 1 2
2 1 2
9 2 2
2 2 2
1 2 2
9 2 2
2 1 2
#save the data in your current working directory
data <- read.table("data", header=TRUE, sep = " ")
data$witness[data$witness == "9"] <- NA
mydata <- data[!is.na(data$witness),]
library("gmodels")
CrossTable(mydata$witness, mydata$agegroup, chisq=TRUE)
您可以将变量“EMS”保留在“mydata”中。它对你的分析没有害处! HTH
答案 1 :(得分:1)