将高斯混合模型拟合到单个特征数据的正确方法是什么?

时间:2017-04-13 07:50:49

标签: python machine-learning scikit-learn reshape mixture-model

data是一维数据数组。

data = [0.0, 7000.0, 0.0, 7000.0, -400.0, 0.0, 7000.0, -400.0, -7400.0, 7000.0, -400.0, -7000.0, -7000.0, 0.0, 0.0, 0.0, -7000.0, 7000.0, 7000.0, 7000.0, 0.0, -7000.0, 6600.0, -7400.0, -400.0, 6600.0, -400.0, -400.0, 6600.0, 6600.0, 6600.0, 7000.0, 6600.0, -7000.0, 0.0, 0.0, -7000.0, -7400.0, 6600.0, -400.0, 7000.0, -7000.0, -7000.0, 0.0, 0.0, -400.0, -7000.0, -7000.0, 7000.0, 7000.0, 0.0, -7000.0, 0.0, 0.0, 6600.0, 6600.0, 6600.0, -7400.0, -400.0, -2000.0, -7000.0, -400.0, -7400.0, 7000.0, 0.0, -7000.0, -7000.0, 0.0, -400.0, -7400.0, -7400.0, 0.0, 0.0, 0.0, -400.0, -400.0, -400.0, -400.0, 6600.0, 0.0, -400.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, -400.0, -400.0, 0.0, 0.0, -400.0, -400.0, 0.0, -400.0, 0.0, -400.0]

我想让一些高斯人适应这些数据并绘制它们。

如果我跑

import numpy as np
from sklearn import mixture

x = np.array(data)
clf = mixture.GaussianMixture(n_components=2, covariance_type='full')
clf.fit(x)

我收到错误

ValueError: Expected n_samples >= n_components but got n_components = 2, n_samples = 1

DeprecationWarning: Passing 1d arrays as data is deprecated in 0.17 and will raise ValueError in 0.19. Reshape your data either using X.reshape(-1, 1) if your data has a single feature or X.reshape(1, -1) if it contains a single sample.

好的......我可以忍受这个。警告告诉我该怎么做。但是,如果我跑

x = np.array(data).reshape(-1,1)
clf = mixture.GaussianMixture(n_components=2, covariance_type='full')
clf.fit(x)

我收到错误

ValueError: Expected the input data X have 1 features, but got 32000 features

我做错了什么?什么是正确的方法?

修改

我刚才意识到我误读了错误信息。 fit()不是score_samples(),而是x = np.linspace(-8000,8000,32000) y = clf.score_samples(x) plt.plot(x, y) plt.show()

我试图在事后策划高斯人。

x

所以x.reshape(-1,1)似乎是个问题。但是,x.reshape(1,-1)没有帮助,也没有$user = User::where("email",$email)->get(['role']);

2 个答案:

答案 0 :(得分:4)

我自己发现了这个错误。正如我在编辑中所述,fit()并未提出错误,而是score_samples()

两个函数都会检测多维数组。

工作代码:

data = np.array(data).reshape(-1,1)
clf = mixture.GaussianMixture(n_components=1, covariance_type='full')
clf.fit(data)

x = np.array(np.linspace(-8000,8000,32000)).reshape(-1,1)
y = clf.score_samples(x)

plt.plot(x, y)
plt.show()

答案 1 :(得分:2)

如果您只有一个功能的样本很多,请尝试

your_samples_list = map(lambda x:[x], your_samples_list)

这会将其转换为列表列表

[a,b,c] -> [[a],[b],[c]]