在R中手动指定主题模型

时间:2015-06-15 21:47:09

标签: r tm lda topicmodels

我在csv文件中有一行文字,每行 唯一指定我感兴趣的“主题”。如果我要运行主题模型这个语料库使用来自topicmodels包或lda的LDA或Gibbs方法,正如预期的那样,我会得到每个“文档”的多个主题(我的CSV中的一行文本,我将其先验定义为我感兴趣的唯一主题) 。我知道这是主题模型的算法和单词假设的结果。

然而,我对此很感兴趣

1)R中是否有一个预先制作的软件包,专为用户使用经验字分布指定主题而设计?也就是说,我不希望估计这些主题;我想告诉R主题是什么。我想我可以使用正确数量的主题运行主题模型,使用该对象的结构然后覆盖其内容。我只是希望有一种更简单或更明显的方式,我现在还没有看到。

思想?

编辑:添加 - 我只是想到了在LDA建模算法中控制主题/术语分布的alpha和beta参数。我可以使用哪些设置会强制模型仅为每个文档找到1个主题?或者是否有允许发生这种情况的设置?

如果这些看起来像我理解的愚蠢问题 - 我对这一特定领域很陌生,我发现它很有吸引力。

1 个答案:

答案 0 :(得分:0)

你想用这种方法做什么?如果您想告诉R主题是什么,以便它可以预测其他行或文档中的主题,那么RTextTools可能是一个有用的包。