标签: cluster-computing
我有几个需要选择的列变量。问题是,在将重要性变量放入聚类部分之前,该如何选择重要性变量?
以下是我的数据集示例:
https://www.dropbox.com/s/vwt0qrohoqbgcgq/sample_dataset.xlsx?dl=0
我的经验只有一个或两个变量可以聚类。在这种情况下,我有20个变量。
有人对我的案子有同样的问题吗?
注意:
因变量(last_balance,trx_prct,trx_prct_m),其余变量为自变量。