我正在处理时间序列数据集,因此在从GaussianMixture()
包中拟合scikit-learn
函数的同时,我需要使每个功能(时间戳)相关。但是,在检查源代码后,我找不到用于自定义协方差矩阵的参数。
凭借我有限的统计知识,我很好奇如何在E步中修改协方差矩阵以将时间依赖性纳入GMM模型。非常感谢。
这是源代码:我要进行的更改是在estimate_gaussian_parameters()函数中 https://github.com/scikit-learn/scikit-learn/blob/7389dba/sklearn/mixture/gaussian_mixture.py#L435
答案 0 :(得分:0)
在darksky的帮助下,我了解到该函数是内置的,并带有covariance-matrix选项。参数covariance_type有4个选项: “完整”(每个组件都有自己的一般协方差矩阵), “绑”(所有组件共享相同的通用协方差矩阵), “ diag”(每个分量都有自己的对角协方差矩阵), “球形”(每个分量都有其自己的单个方差)。
在我的理解中,“球形”用于单变量数据集,“ diag”用于具有多变量但独立特征的数据集。因此,如果要预测多变量和从属特征,则应该使用“完整”或“并列”。