标签: nlp tf-idf naivebayes
我正在使用多项朴素贝叶斯算法将文档分为三类。我想找到每个类别中最重要的“关键字”,类似于使用tf-idf查找文档的关键字。我尝试对语料库中的每个文档使用tf-idf,并根据这些类别中文档的关键字为每个类别获取一些总体关键字列表,但是我找不到一种很好的方法来组合所有这些关键字列表。我还考虑过将每个类别本身视为一个单独的庞大“文档”,并使用tf-idf获取关键字,但是当您只有三个这样的“文档”时,这不会产生很好的效果。
是否有已知/常见的获取类别关键字的方法?