如何从PyMC3中的Dirichlet过程中提取簇ID用于分组数据?

时间:2017-05-23 17:08:16

标签: python process cluster-computing pymc3 dirichlet

我正在使用PyMC3来分组我的分组数据。基本上,我有g个向量,并希望将g向量聚类成m个聚类。但是,我有两个问题。

第一个是,看起来PyMC3只能处理一维数据而不能处理矢量。第二个问题是,我不知道如何提取原始数据的集群ID。我确实提取了组件数(k)和相应的权重。但我无法提取指示每个点属于哪个群集的id。

欢迎任何想法或评论!

1 个答案:

答案 0 :(得分:0)

如果我理解正确,那么您正在尝试提取数据点所属的类别(1到k)。但是,Dirichlet随机变量仅产生概率向量。这应该用作分类RV的先验,当从中采样时,它将产生编号类别。