来自Pandas Python的数据帧关联规则的Transacction ID列。

时间:2016-06-29 18:39:44

标签: python csv pandas dataframe arules

我使用Pandas将CSV导入Python,我希望能够使用一个作为事务ID的列,以便我制定关联规则。

(链接:https://github.com/antonio1695/Python/blob/master/nearBPO/facturas.csv

我希望有人可以帮助我:

使用UUID作为交易ID,让我拥有如下数据框:

UUID     Desc
123ex    Meat,Beer

为了让我获得关联规则,例如:{Meat} => {啤酒}。

此外,我们希望以简单的方式对图书馆提出建议。

感谢您的时间。

1 个答案:

答案 0 :(得分:2)

您可以通过执行以下操作将值聚合到列表中:

df.groupby('UUID')['Desc'].apply(list)

这将为您提供所需内容,如果您希望将UUID作为列返回,您可以在上面调用reset_index

df.groupby('UUID')['Desc'].apply(list).reset_index()

同样对于系列,您仍然可以将其导出到与df相同的csv:

df.groupby('UUID')['Desc'].apply(list).to_csv(your_path)

您可能需要在导出之前命名索引,或者如果您发现reset_index更容易将索引恢复为列,然后调用to_csv