多维拟合与高斯混合模型

时间:2018-02-08 14:42:12

标签: machine-learning scikit-learn gmm

我发现有可能将高斯混合模型拟合到一个带有sklearn的一维信号(例如直方图,见第一张图像)和sklearn.mixture.GaussianMixture(见here

enter image description here

我现在想要在2维中拟合高斯混合模型(例如,参见第二图像)。这也可能吗?

enter image description here

1 个答案:

答案 0 :(得分:0)

您可以采用相同的方法。首先使模型拟合数据(现在它有2列代表x和y值)。然后计算你想要的任何点的可能性。

在下面的示例中,点是从2高斯分布生成的。

# Generate Data
data1 = np.random.multivariate_normal( [3,3], [[1, 0], [0, 1]], 80)
data2 = np.random.multivariate_normal( [-4,2], [[1, 1.5], [1.5, 3]], 120)

X = np.concatenate((data1, data2))
plt.axis([-8, 8, -8, 8])
plt.scatter(X.T[0], X.T[1])
plt.show()

Generated Data

然后拟合数据。请注意,您应该知道分发的数量(在这种情况下,它是2)。

# Fit the data
gmm = GaussianMixture(n_components=2)
gmm.fit(X)

现在,您已估算出分布参数。您可以使用它们来计算任何点的概率。

# Distribution parameters
print(gmm.means_)
[[-3.87809034  2.15419139]
 [ 3.07939341  3.02521961]]

print(gmm.covariances_)
[[[ 0.78359622  1.11780271]
  [ 1.11780271  2.31658265]]

 [[ 0.80263971 -0.03346032]
  [-0.03346032  1.04663585]]]
可以使用

score_sample方法代替。此方法返回给定点的对数似然。

lin_param = (-8, 8, 100)
x = np.linspace(*lin_param)
y = np.linspace(*lin_param)

xx, yy = np.meshgrid(x, y)
pos = np.concatenate((xx.reshape(-1, 1), yy.reshape(-1, 1)), axis = 1)
z = gmm.score_samples(pos) # Note that this method returns log-likehood
# z = np.exp(gmm.score_samples(pos)) # e^x to get likehood values
z = z.reshape(xx.shape)

plt.contourf(x, y, z, 50, cmap="viridis")
plt.show()

Contour Plot