多标签分类到不同的文本

时间:2016-12-06 09:59:52

标签: python machine-learning scikit-learn text-classification

假设我有不同的关键字标记为不同的内容。 比如

{{1}}

然后,我想用分类机器学习模型来建立一个模型。

有没有人可以教我如何使这种多标签分类工作和构建?

P.S。我更喜欢使用scikit-learn library

1 个答案:

答案 0 :(得分:0)

是的,在发布此问题之前,我已阅读此内容。然而,似乎总是过度拟合。这是因为sklearn提供的示例只是针对一些简单的文本,例如一个句子。但是,我现在的文字是谈论大量的工作,而不仅仅是一句话。

实际上,我已经通过kaggle阅读了这个例子。 (https://www.kaggle.com/c/word2vec-nlp-tutorial/details/part-1-for-beginners-bag-of-words)它接近我想要的东西,但是当我尝试将它变成多标签分类时,它似乎很容易过度拟合。

有人会与我分享他对文本挖掘问题的看法吗?