我可以在R中执行广义迭代缩放吗?

时间:2011-11-02 02:30:55

标签: r data-mining text-mining

我希望将我们自己开发的各种机器学习算法平台从C#移植到更强大的数据挖掘平台,例如R.虽然很明显R在很多类型的数据挖掘任务中都很出色,但目前尚不清楚如果它可以用于文本分类。

具体来说,我们从文本中提取一个双字母列表,然后将其分类为15个不同的类别之一,例如:

Bigram名单:珠宝,书籍,手表,鞋子,百货商店 - >类别:购物

我们希望在R中训练模型以及连接到数据库以更大规模地执行此操作。

可以在R中完成吗?

1 个答案:

答案 0 :(得分:1)

嗯,我宁愿开始研究机器学习,但我可能有一个建议:你考虑过Weka吗?有各种各样的算法,并且有一些文档。此外,还有一个使用Weka罐的R包RWeka

编辑: Witten等人也有一个很好的,全面的阅读。 :Data mining包含对Weka的广泛描述以及其他有趣的事物。查看API机会。