我理解dirichlet进程组选择,如下所述:How to decide group assignments in Dirichlet process clustering
但我不明白为什么DP组选择算法不使用新项目的功能来确定最佳组成员资格。如果DP不使用成员的功能来指导组成员身份,他将如何找到不同的组?
答案 0 :(得分:0)
"生成模型"是不是标记新项目的程序。
这是一个假设的程序来生成'假的'数据。如果要生成数据,则必须先选择组,然后生成属性。没有"现有"你可以使用的功能。
要标记观察到的数据,您必须推断出最有可能生成此新数据的参数(如果已随机生成)。
答案 1 :(得分:0)
最初将项目放入随机集群中之后,训练阶段将它们一次移动到它们最接近的集群中,或者在与现有集群不完全匹配的情况下将它们放入新集群中。训练阶段一直进行到收敛为止(项目没有移动到不同的集群中)。