我有一个功能集列表(40个功能),我的想法首先是评估我可以获得的所有组合的分类器。然而,在我做了一些计算后,我发现这些组合将达到数百万!因此,它将需要永远!!!!
我读到了使用随机搜索方法选择随机特征的能力。但是,每次运行随机搜索时,我都会获得相同的功能集。我是否需要更改种子编号或任何选项??
此外,使用随机搜索有效并且可以替代选择所有组合的方法???
感谢您的帮助专家。
非常感谢,
艾哈迈德
答案 0 :(得分:4)
当您想在WEKA中执行属性选择时,您应该考虑2个算法,搜索者和属性评估者(稍后我将讨论它)。
正如你所说,也许你不能尝试Exhaustive search
,因为它花了这么长时间,有贪婪的选择来获得好的结果(取决于问题),如Best first
(基于hill climbing
})。您评论的选项(Random search
)是另一种制作选择子集的方法,它会进行随机迭代以选择要评估的子集。
为什么您获得所选属性的相同子集?因为Random search
总是选择相同的子集,并且评估者确定最佳的一个(最终输出)。但是,如果我更改seed
参数,它应该更改。也许还是......也许不是。为什么?因为如果算法执行足够数量的迭代(尽管它以不同的种子开始),它将获得与前一个相同的子集(收敛),并且评估者将选择与先前执行相同的子集。
如果您不想在选择器输出中获得收敛,只需更改seed
,但选择较小的search percent
来限制探索并获得不同的结果。
但是,在我看来,如果你总是得到相同的结果是因为评估者(我不知道你使用的是什么算法)已经确定这个子集在给定数据集的情况下是“最好的”。我还建议您尝试使用其他选择器,例如Best first
或Genetic search
作为搜索方法。