我刚刚了解了feature hashing(也称为散列技巧),并且有些人认为它是在大型数据集上有效地进行机器学习的重要特性。
但是,我还没有看到这样的东西用于R的机器学习。
Google搜索显示CRAN上确实有一个包hash
。
有人可以提供一个例子,在R中使用它来加速机器学习任务(或者只是为了减少RAM的使用)吗?
答案 0 :(得分:4)
我最近提交了一个名为FeatureHashing
的包。请查看github页面上的demo:https://github.com/wush978/FeatureHashing,如果您有任何使用问题请与我们联系。