删除重复数据帧 - RFM分析的频率

时间:2017-12-13 10:20:27

标签: python pandas pandas-groupby

我正在Online Retail Dataset进行RFM分析。

enter image description here

我想计算每位客户的频率。

FREQUENCY(F)是:购买总数。

为此,我应用了以下代码:

schema_search_path

但是,我不确定这是否包含重复项。我想是的,因为在数据集中,如果购买了多个产品,则可以使用相同的 InvoiceNo CustomerID 。那么,如何删除重复项?

1 个答案:

答案 0 :(得分:1)

试试这个:

 frequency_df.drop_duplicates(subset=['InvoiceNo', 'CustomerID'], keep="first", inplace=True)