我进行了聚类练习,使用K均值(在3个PCA尺寸和5个PCA尺寸上)和GMM(使用5个PCA尺寸)方法,基于12个不同的特征来识别我的主要客户。 K-Means的两个输出都产生了与最佳集合几乎相似的客户(在每种情况下为1182个客户,重叠1156个),而GMM方法给了我660个客户作为最大客户。这660个客户均使用两种K-Means方法。
现在,我想从此列表中找出我的主要客户。您能否提出任何统计方法,我可以用来说这X个客户确实是我的最佳选择,并对其进行一些A / B测试?我不想使用完整的标识集,因为这样做可能会使我花更多的时间来计划如此庞大的客户群。
答案 0 :(得分:1)
尝试一些不错的旧版过滤!选择一项或多项功能,创建自己的指标(也许最重要的客户是购买量最大的客户,或者忠诚度更高/在公司工作时间更长的客户,或者这两个因素的加权总和),在您的660个客户中排序聚类并仅选择N个第一客户,N是您允许的最大客户数量。