用Weka朴素贝叶斯分类器分类文本分类

时间:2012-03-04 18:30:41

标签: weka document-classification

我正在使用Weka进行文本分类任务。 我创建了我的data.arff文件。它包含两个属性:

  1. 文字属性
  2. class attribute
  3. 然后,使用StringToWordVector处理生成的ARFF文件:

      

    java weka.filters.unsupervised.attribute.StringToWordVector -i data / weather.arff -o data / out.arff   然后,使用NaiveBayes:   java weka.classifiers.bayes.NaiveBayes -t data / out.arff -K

    我有这个问题:

      

    weka.core.UnsupportedAttributeTypeException:weka.classifiers.bayes.NaiveBayes:无法处理数字类!       at weka.core.Capabilities.test(Capabilities.java:954)       at weka.core.Capabilities.test(Capabilities.java:1110)       at weka.core.Capabilities.test(Capabilities.java:1023)       at weka.core.Capabilities.testWithFail(Capabilities.java:1302)       at weka.classifiers.bayes.NaiveBayes.buildClassifier(NaiveBayes.java:213)       在weka.classifiers.Evaluation.evaluateModel(Evaluation.java:1076)       at weka.classifiers.Classifier.runClassifier(Classifier.java:312)       at weka.classifiers.bayes.NaiveBayes.main(NaiveBayes.java:944)       at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)       at sun.reflect.NativeMethodAccessorImpl.invoke(Unknown Source)       at sun.reflect.DelegatingMethodAccessorImpl.invoke(Unknown Source)       at java.lang.reflect.Method.invoke(Unknown Source)       在weka.gui.SimpleCLIPanel $ ClassRunner.run(SimpleCLIPanel.java:265)

    有人能帮帮我吗? 我被困在这个级别。

1 个答案:

答案 0 :(得分:0)

它正是它所说的 - 它无法处理类变量的数值。如果您将类变量声明为字符串,请将数值更改为其等效的文本值。