我有一个包含100万客户的数据集。它们分为几类,如电子产品客户,食品和饮料客户等。集团名称为客户提供服务。轮廓。
每个客户都有不同的行为。例如,假设电子客户至少在购物时购买一个电子设备。此交易随机或连续重复。所以我用数字代码表示每笔交易。
(交易价值,交易量,交易类型等)=(100,200,1)
对于每个交易,我在上面都有这个向量。这意味着每个客户都有不同的交易行为。
我想知道每个客户是否有模式?我们有异常值吗?
这基本上是一个分析问题。
你推荐哪种分析?
答案 0 :(得分:0)
你能更具体一点吗?你想要从分析中得到什么?购买模式,异常客户,异常购买?
如果您想确定哪些商品一起购买,请将交易分组在一起,只需列出同时购买的商品并使用apriori算法或类似商品进行购物篮分析。
如果您想找到类似的客户,使用k最近邻居或k表示代表客户购买模式的向量(可能只是购买的商品)。您也可以在单个事务上执行此操作以比较事务。
要确定异常值,您可以使用基于密度的聚类算法(例如DBSCAN)将彼此靠近的客户聚集在一起,并查看那些不在聚类中的客户以确定异常值。