功能组合

时间:2013-01-29 06:53:38

标签: weka

我有一个功能集列表(40个功能),我的想法首先是评估我可以获得的所有组合的分类器。然而,在我做了一些计算后,我发现这些组合将达到数百万!因此,它将需要永远!!!!

我读到了使用随机搜索方法选择随机特征的能力。但是,每次运行随机搜索时,我都会获得相同的功能集。我是否需要更改种子编号或任何选项??

此外,使用随机搜索有效并且可以替代选择所有组合的方法???

感谢您的帮助专家。

非常感谢,

艾哈迈德

1 个答案:

答案 0 :(得分:4)

当您想在WEKA中执行属性选择时,您应该考虑2个算法,搜索者和属性评估者(稍后我将讨论它)。

正如你所说,也许你不能尝试Exhaustive search,因为它花了这么长时间,有贪婪的选择来获得好的结果(取决于问题),如Best first(基于hill climbing })。您评论的选项(Random search)是另一种制作选择子集的方法,它会进行随机迭代以选择要评估的子集。

为什么您获得所选属性的相同子集?因为Random search总是选择相同的子集,并且评估者确定最佳的一个(最终输出)。但是,如果我更改seed参数,它应该更改。也许还是......也许不是。为什么?因为如果算法执行足够数量的迭代(尽管它以不同的种子开始),它将获得与前一个相同的子集(收敛),并且评估者将选择与先前执行相同的子集。

如果您不想在选择器输出中获得收敛,只需更改seed,但选择较小的search percent来限制探索并获得不同的结果。

但是,在我看来,如果你总是得到相同的结果是因为评估者(我不知道你使用的是什么算法)已经确定这个子集在给定数据集的情况下是“最好的”。我还建议您尝试使用其他选择器,例如Best firstGenetic search作为搜索方法。