vowpal wabbit的特点

时间:2013-11-29 11:23:53

标签: machine-learning feature-selection vowpalwabbit

我需要从所有命名空间的子集中选择要素的组合(二次和三次)。我想避免单一的功能。 例如:

1 1 '1-1-48112-c|m m_18 |o o_15 |s s_100390 |t t_20 |n n_5283 |d d_10023 |p p_2606 |w w_1 |f f_6.0 |g g_113119

我想选择所有功能(根据大众的命令行,我使用选项-q m :),它们与命名空间'm'的组合。重要的是,我希望避免使用t_20m_18o_15等所有单一功能。

使用--ignore参数也会删除我不想要的组合。

在源代码中,似乎忽略命名空间在组合之前很早就被删除了。如果需要,我愿意更改大众的源代码。

1 个答案:

答案 0 :(得分:1)

如果要使用2个名称空间之间的交互,同时忽略2个名称空间,则需要自己构建交互功能并将它们传递给模型。

这不应该太难:只需用你想要的功能串联来构建一个新的命名空间,例如:1 1 '1-1-48112-c|mynewnamespace t_20_m_18_o_15

但是,我很好奇你为什么要这样做?包括基本特征加上它们的二次相互作用可能会产生与取出基本特征相似的(如果不是更好的话)预测精度。