下载Ta Feng Grocery数据集的链接

时间:2014-07-29 12:06:28

标签: machine-learning dataset data-mining

我拼命想要下载Ta-Feng杂货数据集几天,但似乎所有链接都被破坏了。我需要为我的msc论文进行数据挖掘/机器学习研究。我还有微软杂货数据库,比利时商店和Weka的Supermarket.arff。然而,在研究中,他们说Ta Feng是所有公共数据集中最大和最有趣的。

http://recsyswiki.com/wiki/Grocery_shopping_datasets

我会非常感谢任何帮助:)干杯!

3 个答案:

答案 0 :(得分:18)

投票的人并不理解为与超市情景相关的机器学习找到这条有价值的信息的难度。这是最大的公开数据集,包含了大丰超市4个月的购物交易。我是从春南教授那里得到的,他非常友好地把它送给我,因为他以前在台湾的研究所的服务器不再支持它了。以下是需要它的每个人的链接:https://sites.google.com/site/dataminingcourse2009/spring2016/annoucement2016/assignment3/D11-02.ZIP

答案 1 :(得分:18)

如果使用此“Ta Feng”数据集的任何人在列名称时都会遇到重大问题。所以我想分享这个。希望这会对某人产生极大的帮助。

它包含这些文件

D11:2000年11月收集的交易数据

D12:2000年12月收集的交易数据

D01:2001年1月收集的交易数据

D02:2001年2月收集的交易数据

交易数据格式

第一行:繁体中文的列定义

第二行和其余部分:数据列以“;”

分隔

列定义

交易日期和时间(时间无效且无用)

客户ID

年龄:10个可能的值,

A< 25,B 25-29,C 30-34,D 35-39,E 40-44,F 45-49,G 50-54,H 55-59,I 60-64,J> 65

居住面积:8个可能的值,A-F:邮政编码区域:105,106,110,114,115,221,G:其他,H:未知存储距离,距离最近:115,221,114,105,106,110

产品子类

产品ID

资产

销售价格

答案 2 :(得分:2)

Dropbox链接似乎已被破坏。您仍然可以通过以下链接下载数据集:

https://sites.google.com/site/dataminingcourse2009/spring2016/annoucement2016/assignment3/D11-02.ZIP