我想训练具有多个主题的贝叶斯高斯混合模型(隐马尔可夫模型)。我正在使用scikit-learn库这样做(https://scikit-learn.org/stable/modules/generated/sklearn.mixture.BayesianGaussianMixture.html#sklearn.mixture.BayesianGaussianMixture.fit),但是我找不到可以告诉该库的地方,所有观察结果都不只是一个主题,而是几个主题。
目前我的代码只是:
model = mix.GaussianMixture(n_components=2,
covariance_type="full",
n_init=100,
random_state=7).fit(dataframe)
我的数组如下:
array([( 50121, 0), ( 50121, 1), ( 50121, 1), ..., (362374, 1),
(362374, 1), (362374, 1)],
dtype=[('user_id', '<i8'), ('correct', '<i8')])
显然,由于dataframe
有两列,所以很麻烦。
我收到此错误:
ValueError: Can't cast from structure to non-structure, except if the structure only has a single field.
非常感谢您的帮助!