我需要拟合多元高斯分布,即获得python中给定音频特征数据集的最近多元高斯的平均向量和协方差矩阵。音频特征(MFCC系数)是N×13矩阵,其中N大约为4K。有人可以概述一下软件包和技术,以便在python中为这些数据拟合高斯吗?
答案 0 :(得分:15)
使用numpy包。 numpy.mean和numpy.cov将为您提供高斯参数估计值。假设您有13个属性且N
是观察次数,则需要在为rowvar=0
矩阵调用numpy.cov
时设置N x 13
(或通过您的转置)矩阵作为函数参数)。
如果您的数据处于numpy数组data
:
mean = np.mean(data, axis=0)
cov = np.cov(data, rowvar=0)