我想估计使用Python计算离散数据的Chi Squared(测试均匀性)测试所需的样本大小,并需要提示如何做到这一点。
总的来说,我想估计两个生产过程的失败率是否显着不同(alpha = 5%)。
我只找到了statsmodels.stats.gof.chisquare_effectsize()函数,但这似乎只适用于拟合度测试。
有什么方法可以确定所需的样本量吗?
我很感激每一个答案。
答案 0 :(得分:2)
You can use statsmodels.stats.GofChisquarePower().solve_power() However, you need to adjust the degrees of freedom (df) to account for the number of variables. You can accomplish this with the n_bins parameter.
<a>
115.94688728433769