我在excel工作表中有数据,该数据本质上是公司生命周期内所有订单的列表(如果重要的话,大约是1.4万个订单。)以下字段与我目前正在尝试的工作有关。
Purchase date (i.e. 6/23/19)
客户ID(分配给每个客户的唯一ID,此ID在所有客户购买中都是恒定的)
Product category (widgets, woozits, etc.)
Sales person (John Doe, Jane Doe, etc.)
我要找出的是我们按类别再按销售人员的重复购买率。
所以理想情况下,我希望能够确定类似的东西
Product category: Widgets
首次从我们这里购买商品的人中有20%的人后来又购买了其他东西
在约翰·多伊(John Doe)出售给首次客户的小部件中,有15%的客户后来从我们这里购买了其他东西
在简·多伊(Jane Doe)出售给首次客户的小部件中,有25%的客户后来从我们这里购买了其他东西。
因此,基本上是想弄清楚不同的销售代表是否在其订单上有更好的重复购买率,但是我们必须将其按产品类别划分,因为我们按类别的重复购买率会相差很大(有些销售代表只销售商品来自某些类别,因此在各个类别之间进行比较是不公平的。)
我相信要做到这一点,我需要弄清楚怎么说
“查找John Doe出售的每个小部件;查看有多少个客户ID不在较早的日期出现;然后查看这些客户ID的百分比在以后的日期出现,而与他们购买的下一个产品类别或销售人员无关来自。”
希望有人可以提供帮助。如果我不能很好地解释某些事情,我感到抱歉,如果有任何困惑,我会尽力澄清。
谢谢!