SLDA。响应变量可能有多少值?

时间:2014-03-18 20:19:58

标签: lda topic-modeling

我试图了解sLDA的工作原理。与LDA相比,它具有与每个文档相关联的响应变量'。每个文档是仅由训练集中的一个主题标记,还是可能由多个主题标记?

如果它必须只使用一个主题作为一个文档的标签,是否有另一个LDA模型为训练集中的每个文档输入几个标签作为输入? 如果sLDA可能使用多个主题作为标签,那么对于带有多标签的sLDA,是否有任何实现(在Python,R,C / C ++,Matlab中)?

1 个答案:

答案 0 :(得分:1)

sLDA有一个响应变量,它是一个标签,但是直接与主题无关。仍然使用常规LDA完全推断出主题,使用概率计算来构建N个主题。每个文档最终都有一个长度为N的向量,表示它“包含”每个主题的强度。在sLDA中,它更进了一步 - 它在模型中也在内部将响应标签与主题相关联,以便能够根据主题向量预测一个前所未见的文档的响应标签应该是什么。