R - 使用朴素贝叶斯分类器结合分类和文本数据

时间:2017-02-24 12:29:42

标签: r naivebayes

我的名为“Classify”的输入数据集包含文本列和分类列。此数据集已经分类。样本如下所示:

Click here to view sample

我根据阅读文本列和分类列对数据(“房间分类”列)进行了分类。我使用了描述(文本列),空调(分类列),照明(分类列),门类型(分类列)列,以便在分类列(房间分类)中导出。现在,我有另一个预测数据集,我必须根据上面图像中显示的分类数据分类规则对“房间分类”进行预测。

我想使用Naive Bayes算法进行此分类。 我尝试了以下版本的朴素贝叶斯:

创建分类器模型(我省略了下面的描述列,因为只能给出分类列作为输入)

classifier <- naiveBayes(Room.classification~ AirConditioning + Lighting + Door.type , data = Classify)

现在我使用上面的分类器模型来预测新的数据集。 我无法使用“描述”列作为模型的输入以及分类列,但我非常想使用它。

我尝试了另一个称为多项式朴素贝叶斯的版本,它只考虑文本列,根据文本列的DTM创建模型,然后预测新的集合。我已按照以下链接中的确切步骤执行此操作。但是这个版本只考虑文本列,即Description。我无法将分类列与文本列一起用于创建模型。

https://rpubs.com/cen0te/naivebayes-sentimentpolarity

我想使用朴素贝叶斯版本,以便考虑使用文本列和分类列来创建模型。对于文本列,应通过创建DTM来使用单词方法。

请给我这样的建议。

0 个答案:

没有答案