我正在使用PyMC3来分组我的分组数据。基本上,我有g个向量,并希望将g向量聚类成m个聚类。但是,我有两个问题。
第一个是,看起来PyMC3只能处理一维数据而不能处理矢量。第二个问题是,我不知道如何提取原始数据的集群ID。我确实提取了组件数(k)和相应的权重。但我无法提取指示每个点属于哪个群集的id。
欢迎任何想法或评论!
答案 0 :(得分:0)
如果我理解正确,那么您正在尝试提取数据点所属的类别(1到k)。但是,Dirichlet随机变量仅产生概率向量。这应该用作分类RV的先验,当从中采样时,它将产生编号类别。