将多元高斯分布拟合到给定数据集

时间:2014-12-01 14:42:55

标签: python machine-learning

我需要拟合多元高斯分布,即获得python中给定音频特征数据集的最近多元高斯的平均向量和协方差矩阵。音频特征(MFCC系数)是N×13矩阵,其中N大约为4K。有人可以概述一下软件包和技术,以便在python中为这些数据拟合高斯吗?

1 个答案:

答案 0 :(得分:15)

使用numpy包。 numpy.meannumpy.cov将为您提供高斯参数估计值。假设您有13个属性且N是观察次数,则需要在为rowvar=0矩阵调用numpy.cov时设置N x 13(或通过您的转置)矩阵作为函数参数)。

如果您的数据处于numpy数组data

mean = np.mean(data, axis=0)
cov = np.cov(data, rowvar=0)