我有一个文本文件中的10个句子列表。 我想使用现有的主题模型来获取每个句子的主题。
在我发现的所有教程中-他们在语料库上训练了主题模型。我想使用经过现有语料库训练的人,然后将其应用于我的句子。
这可能吗?
答案 0 :(得分:0)
是的,只要句子的语言与语料库的语言相匹配,并且程度较小,只要两者的词汇相交即可(尤其是每个主题中最有特色的单词) 。另外,如果句子的人类主题与语料库中捕获的主题之间存在很大差异,那么您可能最终无法明确将主题归于句子(例如,找不到这两个主题都特别类似于句子或换句话说:所有人都相似,但所有人的相似度都较小。
我鼓励您重用可以在句子中找到的模型,并通过实验了解它们是否可以按预期工作。