我正在尝试在WEKA中实现多类分类。 我有很多行,比如银行交易,还有一个被标记为食品,药品,租金等。我想开发一个分类器,可以使用我以前的数据进行训练,并预测它可以属于未来交易的类。如果我是对的,这是多类而不是多标签,因为每个事务只能属于一个类。
以下是我正在考虑的一些算法
在我的数据中功能数量<<<事务的数量,因此我想的是一个vs rest二元分类器,而不是一个vs一个。
另外,我发现Python中的scikit-learn比WEKA好,但我只能在一个处理器上运行scikit-learn。这是真的吗?
任何问题的答案都会有所帮助。 谢谢!
答案 0 :(得分:2)
你可以看看RandomForest,这是一个众所周知的分类器,效率很高。
在scikit-learn中,你有一些类可以用在像RandomForestClassifier这样的几个核心上。它有一个构造函数参数,可用于定义将使用每个可用核心的核心数或值。看一下文档,包含n_jobs参数的构造函数可以用在几个核心
上