用于聚类算法的数据集

时间:2012-04-22 16:24:54

标签: dataset data-mining cluster-analysis

我被要求为不太技术化的观众讲授聚类算法。考虑到这一点,我想做一个简单的练习,我会要求观众识别数据集中的组。但是,我找不到可用于此目的的好数据集。

是否有客户数据集和他们购买的一些我可以用于此目的的产品?或者任何其他可能看起来合适的数据集!

2 个答案:

答案 0 :(得分:0)

我可以建议一个简单的地理位置数据库,例如德国的所有城市。我想你可以免费找到它。或者您可以查找NASA天空数据。也很好聚集。

答案 1 :(得分:0)

这是包含4个月交易的Ta-Feng数据集。从春南教授那里得到了。它现在存储在我的Dropbox文件夹中:https://www.dropbox.com/s/tsd5zd8a7afmzs7/D11-02.ZIP?dl=0每个文件的第一行显示中文的列名。英文是: 日期;会员卡ID;产品分类;产品代码;数量;总交易金额(以新台币计算)