标签: weka text-mining
我有分类问题,数据集只包含两个属性(文本,类别)。我使用StringToWordVector过滤器来添加属性。我面临着决定采用哪些属性的不同之处。
我尝试使用批量过滤器(AttributeSelection-Bestfirst search,CfsSubsetEEval)来减少功能数量。应用过滤器后,我从2000获得了大约10个属性!
您能否告诉我选择最有用的功能应采取的策略?
谢谢