我需要比较样本的频率与人口的频率。所以,假设我们有一个虚构的例子,我有50名男性和40名女性,人口是100名男性和102名女性。
通常,可以使用卡方检验比例来测试样本是否与基于这些频率的总体不同。但是,假设我没有100名男性和102名女性,但有20名男性和4名女性。我不能使用卡方,因为每个细胞必须至少有5个观察值。
怎么办? Google称用户对渔民进行了精确测试。但你能用这个比例吗?如果是这样,你怎么做?
答案 0 :(得分:1)
因此,举个例子,您的人口中包含100名男性和102名女性,您的样本包含20名男性和4名女性。您现在想要测试样本和总体之间的比例相等。您可以自己配置表:
Male Female Total
Population 100 102 202
Sample 20 4 24
Total 120 106 226
与您在问题中的陈述相反,预期频率应该在每个单元格中高于5而不是观察到的频率。预期频率=(行总数*列总数)/总计)。对于任何一个细胞,您都会发现预期的频率小于5.即使是观察到的值为4的细胞。
但是,如果您发现自己处于预期频率低于5的情况,您可以选择应用Yates校正。
正如您所说,使用fisher精确测试也是一种有效的解决方案。在这种情况下,您可以手动计算。请参阅第二个table + formula.
另请查看此site。
祝你好运。