估计多变量分类中的参数

时间:2013-09-29 03:01:46

标签: machine-learning classification bayesian

新手在这里排版我的问题,请原谅我,如果这不起作用。

我正在尝试为多变量分类问题提供贝叶斯分类器,其中假设输入具有多变量正态分布。我选择使用定义为 log(可能性*先验)的判别函数。

但是,从分发来看,

$$ {f(x \ mid \ mu,\ Sigma)=(2 \ pi)^ { - Nd / 2} \ det(\ Sigma)^ { - N / 2} exp [( - 1/2 )(X- \亩)'\西格玛^ { - 1}(x轴\亩)]} $$

我遇到一个术语-log(det($ S_i $)),其中$ S_i $是我的特定类i的样本协方差矩阵。由于我的输入实际上代表了一个方形图像数据,我的$ S_i $发现了一些相关性并导致det(S_i)为零。然后我的判别功能全部转为Inf,这对我来说是灾难性的。

我知道这里肯定会出现很多问题,有人会帮助我吗?


更新:任何人都可以帮助如何使配方工作?

2 个答案:

答案 0 :(得分:0)

我不分析这个概念,因为我不清楚你在这里想要完成什么,并且不知道数据集,但是关于协方差矩阵的问题:

最明显的数据解决方案,其中需要协方差矩阵及其行列式,并且从数值原因来看,不可行的是使用某种降​​维技术以捕获最多信息尺寸,简单地丢弃其余部分。一种这样的方法是主成分分析(PCA),其应用于您的数据并且在例如5-20维之后被截断将产生具有非零行列式的减小的协方差矩阵。

PS。在Cross Validated

上发布此问题可能是个好主意

答案 1 :(得分:0)

可能您没有足够的数据来推断维度d的空间中的参数。通常情况下,您可以采用MAP估计而不是ML。

对于多变量法线,这是normal-inverse-wishart distribution。 MAP估计将逆Wishart分布的矩阵参数添加到ML协方差矩阵估计中,如果选择正确,将消除奇点问题。

如果您实际上正在尝试为正态分布数据创建分类器,而不仅仅是进行实验,那么更好的方法是使用判别方法。多元法线的决策边界是二次的,所以只需将二次内核与SVM结合使用。