我对统计数据很不满意,但我目前需要使用卡方检验来验证两个概率分布在统计上是否相似。
问题是,我一直使用的一些发行版最终都是“确定性的”,即它们的概率为1,概率为0,概率为0。
我一直在使用scipy的stat和函数chisquare来实现我的测试。每当我尝试使用具有那些确定性分布的函数时,得到的p值最终为nan,即使两个被比较的分布都相同,测试也会失败。
我确实理解这种测试应该在连续数据的离散化版本中完成。所以我要问的是,是否有任何解决方法可以在离散甚至“确定性”分布上使用卡方检验。
MVCE:
#!/usr/bin/env
from scipy import stats
distA = [1.0, 0.0]
distB = [1.0, 0.0]
X, p = stats.chisquare(distA, distB)
print X
print p
X和p都应该具有nan值。