我有一个很大的矩阵(形状为(3000,25000)),使用t-SNE / UMAP将其简化为(3000,2)表示形式,并且在该表示形式上的分类性能显着提高。但是,我希望能够了解潜在空间中的特征不是的潜在特征重要性,而是正常空间中的特征。是否有一种方法可以从潜在表示形式和我的feature_importances_
(从围绕它的我的随机森林)到基础特征进行反向转换?
答案 0 :(得分:0)
简短的回答是“否”。 t-SNE的工作原理是表示高维空间中的局部邻域距离,然后尝试在低维空间中保持相同的邻域距离。由于仅基于距离(甚至更多)仅基于附近的距离进行定义,因此在低维方向和高维特征之间没有清晰的映射。
更长的答案是,您可以按照以下方式以互动的方式回答附近的问题:
a)运行t-SNE,进行低维嵌入,然后 b)选择一个您关心的点并找到它的(lowD邻居),然后 c)在这些邻居的高维输入向量上运行PCA
该PCA的前几个组件将在本地显示 最重要的高D功能。
如果您在很多不同的地方尝试此操作,并且每次都获得相同的高D功能,则表明您可以对输入数据运行PCA并以此为基础获得良好的低D表示。
祝你好运!