假设我有不同的关键字标记为不同的内容。 比如
{{1}}
然后,我想用分类机器学习模型来建立一个模型。
有没有人可以教我如何使这种多标签分类工作和构建?
P.S。我更喜欢使用scikit-learn library
答案 0 :(得分:0)
是的,在发布此问题之前,我已阅读此内容。然而,似乎总是过度拟合。这是因为sklearn提供的示例只是针对一些简单的文本,例如一个句子。但是,我现在的文字是谈论大量的工作,而不仅仅是一句话。
实际上,我已经通过kaggle阅读了这个例子。 (https://www.kaggle.com/c/word2vec-nlp-tutorial/details/part-1-for-beginners-bag-of-words)它接近我想要的东西,但是当我尝试将它变成多标签分类时,它似乎很容易过度拟合。
有人会与我分享他对文本挖掘问题的看法吗?