嗨我真的觉得我错过了什么,但我无法弄清楚如何在数据框上计算chisq。 我有一个像测试的数据框,我有什么计算一个chisq来确定一个类别的频率是否高于整个集合。 我也想为所有类别执行它。
cat <- c("aa","bb","cc","dd","aa","cc","bb","aa")
variable <- c(1,1,0,1,0,0,0,1)
test <- as.data.frame(cbind(cat,variable))
testcast <- dcast(test, cat~variable)
testcast.sum <- matrix(c(1,2,3,2),ncol=2,byrow=T)
chisq.test(testcast.sum)
感谢您的帮助!
答案 0 :(得分:-1)
您可以执行卡方检验来检查cat和变量之间的关联,如chisq.test(table(cat,variable))。
我不明白你的意思&#34;为所有类别&#34;执行它。
请注意,根据您发布的数字,卡方测试可能不是一个好选择(参见此处:http://en.wikipedia.org/wiki/Pearson's_chi-squared_test#Problems)