Apache Mahout的数据集

时间:2010-08-16 05:25:21

标签: dataset mahout recommendation-engine

我正在寻找可用于实现Apache Mahout的推荐系统用例的数据集。我只知道来自MovieLens Data Sets群组的GroupLens Research

任何人都知道可以用于推荐系统实施的任何其他数据集吗?我对基于项目的数据集特别感兴趣,但其他数据集也是最受欢迎的。

3 个答案:

答案 0 :(得分:4)

这是来自Mahout的塞巴斯蒂安。

您可能会对捷克约会网站上的数据集感兴趣:http://www.occamslab.com/petricek/data/

顺便说一句,基于项目的术语指的是一种特殊的协同过滤方法,而不是数据集本身,这种方法通常采用大多数协同过滤方法所使用的用户项评级三通的常见形式。

我们很乐意在用户邮件列表上收到您的实验结果和经验(如果您想分享),请发送电子邮件至user@mahout.apache.org

答案 1 :(得分:3)

在搜索数据集时,我发现很少有网站列出可用于数据挖掘的公开数据集。其中一些也可以用于Mahout。

Bixo Labs

UCI Datasets

KDnuggets

答案 2 :(得分:0)

您可以查看iPinYou RTB竞价数据集 Quora:http://qr.ae/OrqgM http://contest.ipinyou.com/data-release.html