应用错误收集

从潜在空间到正常空间关联要素重要性

时间：2019-02-16 02:36:19

标签： machine-learning scikit-learn feature-selection

我有一个很大的矩阵（形状为（3000，25000）），使用t-SNE / UMAP将其简化为（3000,2）表示形式，并且在该表示形式上的分类性能显着提高。但是，我希望能够了解潜在空间中的特征不是的潜在特征重要性，而是正常空间中的特征。是否有一种方法可以从潜在表示形式和我的feature_importances_（从围绕它的我的随机森林）到基础特征进行反向转换？

1 个答案:

答案 0 :(得分：0)

简短的回答是“否”。 t-SNE的工作原理是表示高维空间中的局部邻域距离，然后尝试在低维空间中保持相同的邻域距离。由于仅基于距离（甚至更多）仅基于附近的距离进行定义，因此在低维方向和高维特征之间没有清晰的映射。

更长的答案是，您可以按照以下方式以互动的方式回答附近的问题：

a）运行t-SNE，进行低维嵌入，然后 b）选择一个您关心的点并找到它的（lowD邻居），然后 c）在这些邻居的高维输入向量上运行PCA

该PCA的前几个组件将在本地显示最重要的高D功能。

如果您在很多不同的地方尝试此操作，并且每次都获得相同的高D功能，则表明您可以对输入数据运行PCA并以此为基础获得良好的低D表示。

祝你好运！