BIC(贝叶斯信息准则)应该更低还是更高

时间:2018-07-02 22:50:02

标签: python scikit-learn bayesian

我对BIC图与GMM中组件的数量非常困惑。 Python文档说的越低越好,但是我在一些网站上看到,正确的簇数是局部最大值的第一位置!!!

任何人都可以详细说明吗,Python是否使用了不同的方程式或将负号乘以BIC分数方程式?

1 个答案:

答案 0 :(得分:1)

似乎BIC定义在不同来源上有所变化。这是bic方法的源代码:

    def bic(self, X):
    . . . 
    return (-2 * self.score(X) * X.shape[0] +
            self._n_parameters() * np.log(X.shape[0]))

随着模型复杂度的增加,bic值增加,而随着似然性的增加,bic减小。因此,越低越好。 此定义与related the wikipedia page上的公式相同。

此外,我在Wikipedia页面上发现了此注释,该注释可能解释了为什么此定义不符合您的期望:

  

注:Claeskens和Hjort(2008)定义的AIC,AICc和BIC与本文和大多数其他标准参考文献中的定义相反。