从卡方检验中选择重要病例

时间:2011-10-13 11:36:38

标签: r

我尝试了这个question中给出的循环函数,它似乎有效。但是,我还有两个问题。首先我有4753个比较,但R只列出了从1946年到4752的那些。有没有办法得到之前的1945个案例?我已经将控制台的长度更改为100000行,但这似乎不起作用。

1946 1946         focushumrights            pillar4info      0.867   1   0.352
1947 1947         focushumrights        pillar4campagne      0.053   1   0.818

...

4752 4752     improveorglearning         improvenetwork     49.064   9   0.000
4753 4753      improvetechexpert         improvenetwork     43.738   9   0.000

其次,我得到4753个结果,其中只有少数是重要的。有没有办法根据小于0.1或0.05的“p值”自动筛选出重要案例。

1 个答案:

答案 0 :(得分:2)

您对显示的内容以及正在存储的内容感到困惑。我假设您在自己的问题中引用的answer中使用question。答案是一个返回数据框的函数。您应该存储数据框,然后根据需要选择行。例如,

##Example function that returns a data frame
f = function(N=1000){
 out <- data.frame("Row" = 1:N
                   , "Column" = 1:N
                   , "Chi.Square" = runif(N)
                   ,  "df"= sample(N, 1:10, replace=T)
                   ,  "p.value" = round(runif(N), 3)
                   )
 return(out)
}

#Would just print everything to the screen
f()
##Store in a data frame
results = f()
##Select rows as needed
results[results$p.value < 0.05,]