聚类并产生最终结果,以找到下一个要定位的最佳客户(排名)

时间:2020-02-06 18:45:17

标签: python-3.x machine-learning prediction hierarchical-clustering unsupervised-learning

我遇到一个问题,我需要对具有所有可能属性的客户数据进行聚类,以识别可以在购买某种产品方面接替最后一位客户的下一位潜在客户。我的数据框大约有5000行和51个要素,我需要从中得出此结果。我了解,首先我需要执行聚类以形成正确的组,但是接下来呢?我已经完成了以下步骤:

EDA 
Correlation analysis
Enoding of categorical features
Scaling of the data basis standard scalar 
PCA - Achieved a final set of 21 components retained within 90% variance

首先,如何将数据集形式的最终组件用于聚类算法? 第二,最适合这种问题的聚类方法是什么?分层凝聚?

在聚类之后,我需要以一种方式构建模型,使得最终输出应为我提供客户ID和按顺序排列的次优5个客户(最强属性组合)。例如:支出,性别,薪水,居住地区等

这是一个不受监督的问题,但是最终,我需要将数据集拆分为测试数据,并使用目标变量“重要客户”(其标记为0和1定义我的潜在重要目标客户)训练数据。该模型应该能够按排名(从高到低)的顺序给我列出具有5个潜在继任者的客户

0 个答案:

没有答案