我使用Pandas将CSV导入Python,我希望能够使用一个作为事务ID的列,以便我制定关联规则。
(链接:https://github.com/antonio1695/Python/blob/master/nearBPO/facturas.csv)
我希望有人可以帮助我:
使用UUID作为交易ID,让我拥有如下数据框:
UUID Desc
123ex Meat,Beer
为了让我获得关联规则,例如:{Meat} => {啤酒}。
此外,我们希望以简单的方式对图书馆提出建议。
感谢您的时间。
答案 0 :(得分:2)
您可以通过执行以下操作将值聚合到列表中:
df.groupby('UUID')['Desc'].apply(list)
这将为您提供所需内容,如果您希望将UUID作为列返回,您可以在上面调用reset_index
:
df.groupby('UUID')['Desc'].apply(list).reset_index()
同样对于系列,您仍然可以将其导出到与df相同的csv:
df.groupby('UUID')['Desc'].apply(list).to_csv(your_path)
您可能需要在导出之前命名索引,或者如果您发现reset_index
更容易将索引恢复为列,然后调用to_csv