Python中的市场篮子和聚类

时间:2018-05-24 09:10:51

标签: python cluster-analysis market-basket-analysis

我有一只大熊猫DataFrame,如下所示:

OrderID     OrderedItems    ItemsQuantity
10052009    I0                  2
10052009    I1                  1
10052009    I2                  1
10052009    I3                  1
10448900    I4                  5
10448900    I5                  5
10189322    I2                  1
10189322    I2                  1

现在,我想知道所有物品是一起订购的还是现有的捆绑包。

1 个答案:

答案 0 :(得分:-1)

我假设您了解群集算法等。您可以使用此数据,并在sklearn的帮助下,请在任何其他群集Algo上运行K Means。

http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html

PS:我假设你的这只是数据样本。

进一步类似地,您可以运行Association algos。