非结构化数据的文本分析

时间:2019-03-07 09:41:22

标签: python classification naivebayes

我有一个问题 我确实有大量的非结构化文本数据,我想将其分类为不同的扇区。

我为此使用了朴素贝叶斯分类器

现在,我的问题是我应该通过Y?因为我没有目标值

并且按照语法我必须通过它。

mnb = MultinomialNB()

mnb.fit(X,y)

TypeError: fit() missing 1 required positional argument: 'y'

正如我所说,我没有目标值。

我该怎么做?

我们将为您提供帮助

1 个答案:

答案 0 :(得分:0)

朴素贝叶斯分类器是一种有监督的学习方法,要求您使用预先知道目标的带标签数据对其进行训练。然后,您可以将其用于未标记的数据以预测将来的值,但不能针对没有目标值的数据进行训练。

在不了解您的任务的情况下很难推荐其他方法,但是听起来您想研究无监督的聚类算法。 k均值是一个相对简单的起点。