使用RWeka创建Naive Bayes分类器时遇到问题

时间:2019-04-12 15:26:22

标签: r dataframe matrix formula rweka

我正在尝试通过RWeka创建NB分类器,并且它返回变量类型错误。

我有以下变量:

dtm_df.train作为包含以下内容的data.frame

      ask check state
1_10    0     1   bad
1_100   1     0   bad
1_11    2     1  good
1_13    0     0   bad
1_14    0     0  good
1_15    0     1   bad
1_16    0     1  good
1_17    0     0   bad
1_19    0     0   bad
1_2     2     0   bad

class.formula作为包含以下内容的公式:state ~ ask + check

使用时

NB <- make_Weka_classifier("weka/classifiers/bayes/NaiveBayes")
classifier <- NB(class.formula ~ ., dtm_df.train)

它返回:

Error in model.frame.default(formula = class.formula ~ ., data = dtm_df.train) : object is not a matrix

将数据参数dtm_df.train转换为矩阵不起作用,因为它需要一个data.frame。

尝试时:

classifier <- NB(class.formula ~ ., dtm_df.train)

返回

Error in .jcall(o, "Ljava/lang/Class;", "getClass") : 
  weka.core.UnsupportedAttributeTypeException: weka.classifiers.bayes.NaiveBayes: Cannot handle string class!

1 个答案:

答案 0 :(得分:0)

发现原因实际上是火车集合P中的状态列的格式。

该解决方案通过以下方式将该列转换为因子:

dtm_df.train