我有一个分类问题,为了解决这个问题,我计划使用不同的功能集,比如unigramms和bigramms,也许更晚。我想尝试这些功能集的不同组合。最好的方法是什么?我是否必须为不同的功能组合准备不同的文件?
答案 0 :(得分:1)
一种简单的方法是使用“RemoveByName”过滤器,根据正则表达式过滤掉属性。因此,例如,如果unigram功能名称以“uni_”开头而bigrams以“bi_”开头,则可以使用RemoveByName -E ^ uni_仅保留bigrams。您可以通过GUI执行此操作,作为预处理步骤,或使用元“FilteredClassifier”。
但是,我无法想到在WEKA中尝试不同组合的自动方式。