寻找原始功能'对内核PCA中用作输入的主要组件的影响

时间:2018-05-30 21:00:35

标签: python machine-learning cluster-analysis pca kernel-density

我正在尝试将Kernel PCA实现到我的数据集,该数据集具有分类(使用一个热编码器编码)和数字特征,并且总共减少了从22维到3维的维数。之后,我将继续集群实施。我使用Spyder作为IDE。 为了从算法中理解我生成的簇的结构,我想解释哪些特征会影响派生的主成分以及它们如何影响它们。 可能吗?如果是这样,我怎么解释这个,有什么方法吗?

1 个答案:

答案 0 :(得分:0)

由于您在内核空间中应用PCA,因此与原始特征和简化数据的特征存在严格的非线性关系;您计算的特征向量在内核空间中开始。这阻碍了直接的方法,但也许你可以进行某种敏感性分析。对原始特征应用小扰动,并测量最终的减少特征如何对它们作出反应。雅各布的最终特征与原始特征相关也是一个很好的起点。