我有一个麦克斯韦分布观察,我符合预期的麦克斯韦分布。然后我进行卡方检验以找出合适的优点。然而,我得到了很好的结果,我也想找出卡方测试使用的自由度。引用文档chisquare
:使用具有k-1-ddof自由度的卡方分布计算p值,其中k是观察到的频率的数量。 ddof的默认值为0.
这里的k到底是什么?它是我拥有的数据点总数(41000)吗?或者它是每箱的频率?
答案 0 :(得分:4)
k
的大小为f_obs
,chisquare
的第一个参数。这是箱子的数量。
例如,在docstring中的以下示例中,
>>> chisquare([16, 18, 16, 14, 12, 12])
(2.0, 0.84914503608460956)
f_obs
为[16, 18, 16, 14, 12, 12]
,k
为len(f_obs)
或6。
答案 1 :(得分:-1)
文档遵循典型的统计变量名称。 K-1是自由度。 K表示每种尺寸n的样品量。所以用你的话说,每箱的频率。
http://statistics.about.com/od/Inferential-Statistics/a/What-Is-A-Degree-Of-Freedom.htm的最后一段是:
计算自由度的另一种方法的另一个例子是F测试。在进行F测试时,我们有k个样本,每个样本大小为n。分子中的自由度为k - 1,分母中的自由度为k(n - 1)。