如何派生集群属性

时间:2016-01-16 22:10:16

标签: machine-learning cluster-analysis data-mining

我已将约40000个点聚为79个群集。每个点都是18个特征的向量。我想“推导”每个群集的特征 - 群集的突出特征/特征。是否有机器学习算法来推导出这个?

1 个答案:

答案 0 :(得分:2)

如果您确信群集对您的特定需求有意义,则可以将其视为分类问题。

一种选择是应用特征选择算法对特征进行排名。您可以使用递归功能消除来识别可预测群集标签的功能子集。

解释群集的另一个好方法是构建决策树。使用决策树,您可以看到使用哪些功能来最好地分隔类(在您的情况下为群集)。您还可以使用像随机森林这样的集合并询问要素重要性分数。