在R中使用特征散列/散列技巧进行机器学习

时间:2014-03-08 16:43:08

标签: r performance machine-learning hash large-data

我刚刚了解了feature hashing(也称为散列技巧),并且有些人认为它是在大型数据集上有效地进行机器学习的重要特性。

但是,我还没有看到这样的东西用于R的机器学习。

Google搜索显示CRAN上确实有一个包hash

有人可以提供一个例子,在R中使用它来加速机器学习任务(或者只是为了减少RAM的使用)吗?

1 个答案:

答案 0 :(得分:4)

我最近提交了一个名为FeatureHashing的包。请查看github页面上的demo:https://github.com/wush978/FeatureHashing,如果您有任何使用问题请与我们联系。