machine-learning - 我们应该在＆＃34;标题＆＃34;上使用LDA算法吗？还是内容？ - Thinbug

我们应该在＆＃34;标题＆＃34;上使用LDA算法吗？还是内容？

时间：2018-04-16 06:00:27

标签： machine-learning lda document-classification

我正在与LDA合作进行文档分类。我在一个部分感到困惑。我们是否应该使用文档标题或文档内容使用LDA进行分类？我有一大堆文档，在内容上使用LDA会导致MemoryError甚至少量主题（~5-10）。

据我所知，它需要8 * num_topics * dictionary_size字节的内存，这可能是内存耗尽的原因。它在文档标题上效果更好。

我应该将LDA用于主题吗？还有其他算法如Word2Vec用于内容？

0 个答案:

没有答案