我使用LDA对小型文档进行分类,大约4-5行。
我将他们分类为科技,政治,艺术,音乐等主题
我使用维基百科下载每个类别的文章(技术,政治,艺术等)并为每个类别培训LDA
维基百科是巨大的(约8GB压缩),计算需要数小时!并在我的硬盘中占用了大量空间
是否有任何工具包已经提供"现成的"我可以直接用于分类的通用主题?
答案 0 :(得分:1)
有很多在线API将文本分类为一组预定义的主题。例如,https://www.textrazor.com/demo标识商业,法律和政治等主题。您还可以查看MeaningCloud或AlchemyAPI。大多数这些服务都是付费的,但根据您的需要,确实有足够的免费等级。