现成的使用LDA对文档进行分类的主题?

时间:2015-04-10 12:09:08

标签: python nlp text-processing gensim

我使用LDA对小型文档进行分类,大约4-5行。

我将他们分类为科技,政治,艺术,音乐等主题

我使用维基百科下载每个类别的文章(技术,政治,艺术等)并为每个类别培训LDA

维基百科是巨大的(约8GB压缩),计算需要数小时!并在我的硬盘中占用了大量空间

是否有任何工具包已经提供"现成的"我可以直接用于分类的通用主题?

1 个答案:

答案 0 :(得分:1)

有很多在线API将文本分类为一组预定义的主题。例如,https://www.textrazor.com/demo标识商业,法律和政治等主题。您还可以查看MeaningCloudAlchemyAPI。大多数这些服务都是付费的,但根据您的需要,确实有足够的免费等级。