dirichlet过程组选择

时间:2018-02-21 02:09:35

标签: process cluster-analysis probability distribution dirichlet

我理解dirichlet进程组选择,如下所述:How to decide group assignments in Dirichlet process clustering

但我不明白为什么DP组选择算法不使用新项目的功能来确定最佳组成员资格。如果DP不使用成员的功能来指导组成员身份,他将如何找到不同的组?

2 个答案:

答案 0 :(得分:0)

"生成模型"是不是标记新项目的程序。

这是一个假设的程序来生成'假的'数据。如果要生成数据,则必须先选择组,然后生成属性。没有"现有"你可以使用的功能。

要标记观察到的数据,您必须推断出最有可能生成此新数据的参数(如果已随机生成)。

答案 1 :(得分:0)

最初将项目放入随机集群中之后,训练阶段将它们一次移动到它们最接近的集群中,或者在与现有集群不完全匹配的情况下将它们放入新集群中。训练阶段一直进行到收敛为止(项目没有移动到不同的集群中)。