我有一只大熊猫DataFrame
,如下所示:
OrderID OrderedItems ItemsQuantity
10052009 I0 2
10052009 I1 1
10052009 I2 1
10052009 I3 1
10448900 I4 5
10448900 I5 5
10189322 I2 1
10189322 I2 1
现在,我想知道所有物品是一起订购的还是现有的捆绑包。
答案 0 :(得分:-1)
我假设您了解群集算法等。您可以使用此数据,并在sklearn的帮助下,请在任何其他群集Algo上运行K Means。
http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html
PS:我假设你的这只是数据样本。
进一步类似地,您可以运行Association algos。