我很抱歉,如果它不是正确的地方,但我没有在其他地方找到答案。我想知道我是否理解使用蒙特卡罗模拟来使用chisq.test()。
我有一个定性变量,有128个级别/类。我的样本量是26(我无法对更多的“个体”进行抽样)。显然,我会有0个“个人”的某个级别。但事实是,在127种可能的情况下,我只有极少数类别。正如所说(我不完全理解其原因),应用卡方检验我们每个级别至少应该有5个人,我以为我必须使用simulate.p.value选项(在R中)使用蒙特卡罗模拟来估计分布并计算p值。没有蒙特卡罗模拟,R给我一个p值< 1E-16。使用蒙特卡罗模拟,它给出了4e-5的p值。
我尝试使用26个1和101个零的向量计算p值,并且使用蒙特卡罗模拟,我得到p值为1.
可以说,即使我的样本量与可能类的数量相比较小,观察到的分布也是不可能所有可能的类以相同的概率存在(1/127)在真人口中?
感谢您的帮助
于连