WEKA中的多类分类

时间:2015-06-04 21:04:30

标签: machine-learning scikit-learn classification weka libsvm

我正在尝试在WEKA中实现多类分类。 我有很多行,比如银行交易,还有一个被标记为食品,药品,租金等。我想开发一个分类器,可以使用我以前的数据进行训练,并预测它可以属于未来交易的类。如果我是对的,这是多类而不是多标签,因为每个事务只能属于一个类。

以下是我正在考虑的一些算法

  1. 朴素贝叶斯
  2. 多项Logistic回归
  3. 多类SVM
  4. Max Entropy
  5. 神经网络(如果可能)
  6. 在我的数据中功能数量<<<事务的数量,因此我想的是一个vs rest二元分类器,而不是一个vs一个。

    1. 我是否应该采用其他算法来帮助实现目标?
    2. 我放的任何算法对我的目标都没用吗?
    3. 另外,我发现Python中的scikit-learn比WEKA好,但我只能在一个处理器上运行scikit-learn。这是真的吗?

      任何问题的答案都会有所帮助。 谢谢!

1 个答案:

答案 0 :(得分:2)

你可以看看RandomForest,这是一个众所周知的分类器,效率很高。

在scikit-learn中,你有一些类可以用在像RandomForestClassifier这样的几个核心上。它有一个构造函数参数,可用于定义将使用每个可用核心的核​​心数或值。看一下文档,包含n_jobs参数的构造函数可以用在几个核心