我希望将我们自己开发的各种机器学习算法平台从C#移植到更强大的数据挖掘平台,例如R.虽然很明显R在很多类型的数据挖掘任务中都很出色,但目前尚不清楚如果它可以用于文本分类。
具体来说,我们从文本中提取一个双字母列表,然后将其分类为15个不同的类别之一,例如:
Bigram名单:珠宝,书籍,手表,鞋子,百货商店 - >类别:购物
我们希望在R中训练模型以及连接到数据库以更大规模地执行此操作。
可以在R中完成吗?
答案 0 :(得分:1)
嗯,我宁愿开始研究机器学习,但我可能有一个建议:你考虑过Weka吗?有各种各样的算法,并且有一些文档。此外,还有一个使用Weka罐的R包RWeka
。
编辑: Witten等人也有一个很好的,全面的阅读。 :Data mining包含对Weka的广泛描述以及其他有趣的事物。查看API机会。