Scikit-multilearn MEKA包装器:meka.classifiers.multilable.meta.CM

时间:2019-03-19 12:18:15

标签: python scikit-learn weka scikit-multilearn

我目前正在使用scikit-multilearn进行多标签分类。我必须用 meka.classifiers.multilabel.CM 作为meka_classifier。
但是,当我运行代码时,会遇到不同的错误,而且我也不明白为什么。

meka = Meka(
    meka_classifier="meka.classifiers.multilabel.meta.CM",
    weka_classifier = "weka.classifiers.trees.J48", 
    meka_classpath = meka_classpath#, #obtained via download_meka
)
print("Fit")
meka.fit(X_train, y_train)

我必须说,traningsdata和路径(Weka和Java(通过wichcraft))都可以正常工作。如果我与BR交换meka_classifier,那么所有方法都有效。
运行代码后,我收到以下错误消息:

weka.core.UnsupportedAttributeTypeException: weka.classifiers.trees.J48: Cannot handle numeric class!
at weka.core.Capabilities.test(Capabilities.java:1067)
at weka.core.Capabilities.test(Capabilities.java:1256)
at weka.core.Capabilities.test(Capabilities.java:1138)
at weka.core.Capabilities.testWithFail(Capabilities.java:1468)
at weka.classifiers.trees.J48.buildClassifier(J48.java:277)
at meka.classifiers.multilabel.meta.CM.buildClassifier(CM.java:50)
at meka.classifiers.multilabel.Evaluation.runExperiment(Evaluation.java:229)
at meka.classifiers.multilabel.ProblemTransformationMethod.runClassifier(ProblemTransformationMethod.java:172)
at meka.classifiers.multilabel.ProblemTransformationMethod.evaluation(ProblemTransformationMethod.java:152)
at meka.classifiers.multilabel.meta.CM.main(CM.java:83)

很奇怪,它说他不能处理数字值,因为如果我更改为BR,则分类器对(相同)数据没有任何问题。
在Errormessage上方还有一个有关如何使用分类器(选项)的文本。所以我尝试了另一种方式:

meka = Meka(
    meka_classifier = "meka.classifiers.multilabel.meta.CM  -I 10 -W meka.classifiers.multilabel.CC - -S 0 -W weka.classifiers.trees.J48", 
    #weka_classifier = "weka.classifiers.trees.J48", 
    meka_classpath = meka_classpath#, #obtained via download_meka
)

 print("Fit Data")
 meka.fit(X_train, y_train)

 print("Predict")
 prediction = meka.predict(x_test)

这里有带weka_classifier的命令行,因为我以不同的方式尝试了它(从meka_classifier中排除了J48,并在其中包含了它)。 无论如何,我总是会遇到相同的错误:

Traceback (most recent call last):
File "C:/Users/*****/Desktop/MachineLearningClassifier/blabla.py", line 72, in <module>
prediction = meka.predict(x_test)
File "D:\Users\*****\AppData\Local\Programs\Python\Python36\lib\site-packages\skmultilearn\ext\meka.py", line 314, in predict
self._parse_output()
File "D:\Users\*****\AppData\Local\Programs\Python\Python36\lib\site-packages\skmultilearn\ext\meka.py", line 374, in _parse_output
predictions = self.output_.split(predictions_split_head)[1].split(
IndexError: list index out of range

我已经搜索了此错误,并且在那里安装了arff而不是liac-arff的人在这里,但事实并非如此。是的,就像我说的那样,如果我改用BR或其他所有方法都可以。只是不适用于CM。我现在不知道该怎么办...我希望有人可以提供帮助。预先感谢!

最好的问候

编辑:
在fit()之后,我让我打印 meka.classifier_dump ,并使用我发布的第二个代码,它是空的!我已经与BR等其他公司进行了测试,但它并不为空。所以我认为我在创建分类器时做错了什么?

1 个答案:

答案 0 :(得分:0)

错误weka.core.UnsupportedAttributeTypeException: weka.classifiers.trees.J48: Cannot handle numeric class!指出J48算法不能用于数字类。这里的class表示要学习的输出,而不是学习时使用的属性。 J48可以使用数字属性,但不能预测数字类。

您无法在J48中预测数值(例如,将温度预测为整数),只能使用J48预测名义类型(例如,冷/中性/热)。

要使用J48,您需要将类更改为标称。