我正在使用Weka并应用J48来构建我的分类器。我有40个功能,2000个实例(700个a级和1300个b级)。
J48决策树只使用40个中的2个功能!是否有允许J48使用所有功能或是否有任何其他允许使用所有功能的算法?
提前致谢。
答案 0 :(得分:1)
可能是因为J48不需要更多属性。
您可以在Select attribute
标签中检查功能的相关性,并使用Ranker
作为搜索方法运行选择器,并使用Principal Components
作为评估者。它将向您展示每个功能与每个类之间的关系,它还会告诉您哪些功能最能描述您的类。
答案 1 :(得分:0)
分类不需要所有40个特征。因为某些功能可能是多余的(例如相关的)或不包含歧视性信息。
您可以先从 Weka Explorer 中的Select attributes
标签运行功能选择,然后查看哪些功能很重要。
此外,您可以测试SVM
(libSVM或SMO),Neural Network
(MultilayerPerceptron)和/或Random Forest
等分类器,因为它们往往会提供最佳的分类结果(问题依赖性)