在sas-simpson悖论中进行卡方检验以确保独立性

时间:2014-06-25 13:55:44

标签: testing aggregate paradox chi-squared

我想知道学生在特定考试中的表现与教育辍学水平之间是否存在关联。我有一个2×2矩阵,其中变量Level in test,取值为1和2,以及变量dropout,其值为非活动且有效。 (你可以说级别1 =通过测试而级别2 =未通过)。

我可以看到我对“simpson paradox”这个术语有疑问,因为我得知教师中的每一项教育都有一个高p值,表明测试和辍学之间没有水平关系。但是当我对数据进行分组并对整个教师进行分析时,我得到一个低p值,表明变量之间存在显着的关系。 我试图阅读有关辛普森悖论的内容,但我似乎没有得到如何处理这个问题的信息? 我读过一个不应该对聚合数据进行测试的地方,但这不是真的吗? enter image description here

我真的希望有人可以帮助我!

亲切的问候玛丽亚

2 个答案:

答案 0 :(得分:0)

对于标记为“教育2”和“教育5”的交叉表,您的单元格值小于5,这违反了运行卡方的假设。关于卡方是否具有足够强大的测试能力以抵御这些限制,我们仍有争议,但我仍然会重新考虑你的分组方法。

答案 1 :(得分:0)

由于“教师”中的病例总数较高,因此数据足以反驳独立性假设,因此p值较低。当病例数很少(您的教育1到教育5表),没有足够的数据显示重要性。这里更高的p值只表示差异可能是偶然的。

这不是辛普森悖论的一个例子。