多标签文本分类NLTK

时间:2016-03-01 21:59:49

标签: classification nltk

我在分类器上工作,必须执行以下操作: 使用一个,两个甚至三个标签(30个不同标签的来源)对给定的小文本进行分类。 标签彼此独立给出,因此我需要分类器来计算所有30个标签的概率 并且只给出具有给定概率百分比的三个。如果只有一个标签高于该概率,那么它只会分配这个标签, 如果两个在上面,那么它将分配这两个标签。

我有一套约25 000个已标记的文本,可用于培训目的。 我的问题是我可以轻松训练我的分类器为文本分类一个标签,但我不知道如何制作它 一次最多标记三个标签。我一直读到NLTK可以进行多标记,但我几乎找不到任何好的来源 没有人帮我解决我的具体问题。 我也试过scikit和textblob,但没有任何成功。

我有什么监督?谢谢你的帮助!

0 个答案:

没有答案