用户分析和异常值检测

时间:2014-03-21 16:02:00

标签: data-mining

我有一个包含100万客户的数据集。它们分为几类,如电子产品客户,食品和饮料客户等。集团名称为客户提供服务。轮廓。

每个客户都有不同的行为。例如,假设电子客户至少在购物时购买一个电子设备。此交易随机或连续重复。所以我用数字代码表示每笔交易。

(交易价值,交易量,交易类型等)=(100,200,1)

对于每个交易,我在上面都有这个向量。这意味着每个客户都有不同的交易行为。

我想知道每个客户是否有模式?我们有异常值吗?

这基本上是一个分析问题。

你推荐哪种分析?

1 个答案:

答案 0 :(得分:0)

你能更具体一点吗?你想要从分析中得到什么?购买模式,异常客户,异常购买?

如果您想确定哪些商品一起购买,请将交易分组在一起,只需列出同时购买的商品并使用apriori算法或类似商品进行购物篮分析。

如果您想找到类似的客户,使用k最近邻居或k表示代表客户购买模式的向量(可能只是购买的商品)。您也可以在单个事务上执行此操作以比较事务。

要确定异常值,您可以使用基于密度的聚类算法(例如DBSCAN)将彼此靠近的客户聚集在一起,并查看那些不在聚类中的客户以确定异常值。