我第一次尝试Gensim,现在有个问题。我已经训练了一个LSI模型和一套准备好的文件。我的问题是,如何知道新文档是否与我从文档语料库生成的模型类似。我不想知道文档与我的语料库中的每个文档的相似性,如MatrixSimilarity,但我们知道该文档是否与我的主题/模型类似。
答案 0 :(得分:1)
我认为您应该对新文档执行LSI,然后计算主题之间的相似性。 https://stats.stackexchange.com/questions/271359/using-lda-to-calculate-similarity/271368