高斯混合模型对尺寸的重要性不同

时间:2017-11-29 20:49:08

标签: scikit-learn cluster-analysis probability gmm

是否有任何策略或黑客可以对数据的不同维度给予不同的重视?

这意味着,当在多维数据上拟合GMM时,向一个方向的距离比向其他方向的距离更难。 我考虑的选项:

  • 预处理:尺寸的简单缩放将无效,因为GMM只会学习类似的缩放差异。
  • 操纵EM算法:我尝试在每个M步之后将协方差矩阵缩放到不太重要的维度的方向。适度成功。

我有点意外,我找不到有关这个非常明显的用例的信息。

0 个答案:

没有答案