我正在Online Retail Dataset进行RFM分析。
我想计算每位客户的频率。
FREQUENCY(F)是:购买总数。
为此,我应用了以下代码:
schema_search_path
但是,我不确定这是否包含重复项。我想是的,因为在数据集中,如果购买了多个产品,则可以使用相同的 InvoiceNo 和 CustomerID 。那么,如何删除重复项?
答案 0 :(得分:1)
试试这个:
frequency_df.drop_duplicates(subset=['InvoiceNo', 'CustomerID'], keep="first", inplace=True)