如何在执行多维缩放后获得特征值?

时间:2016-06-30 02:09:18

标签: python scikit-learn eigenvalue dimensionality-reduction multi-dimensional-scaling

我有兴趣在执行多维缩放后查看特征值。什么功能可以做到这一点?我查看了documentation,但它根本没有提到特征值。

以下是代码示例:

mds = manifold.MDS(n_components=100, max_iter=3000, eps=1e-9,
                   random_state=seed, dissimilarity="precomputed", n_jobs=1)
results = mds.fit(wordDissimilarityMatrix)
# need a way to get the Eigenvalues

1 个答案:

答案 0 :(得分:0)

我也无法通过阅读文档找到它。我怀疑他们没有表现classical MDS,而是表现得更复杂:

  

“现代多维尺度 - 理论与应用”Borg,I。; Groenen P. Springer系列统计(1997)

     

“Nonmetric multidimensional scaling:a numerical method”Kruskal,J。Psychometrika,29(1964)

     

“通过优化非拟合假设的拟合优度进行多维尺度缩放”Kruskal,J。Psychometrika,29,(1964)

如果您正在寻找每个经典MDS的特征值,那么自己获取它们并不难。步骤是:

  1. 获取距离矩阵。把它放在一边。
  2. 执行双重定心。
  3. 查找特征值和特征向量
  4. 选择前k个特征值。
  5. 您的第i个主要成分是sqrt(eigenvalue_i)* eigenvector_i
  6. 请参阅下面的代码示例:

    import numpy.linalg as la
    import pandas as pd
    
    # get some distance matrix
    df = pd.read_csv("http://rosetta.reltech.org/TC/v15/Mapping/data/dist-Aus.csv")
    A = df.values.T[1:].astype(float)
    # square it
    A = A**2
    
    # centering matrix
    n = A.shape[0]
    J_c = 1./n*(np.eye(n) - 1 + (n-1)*np.eye(n))
    
    # perform double centering
    B = -0.5*(J_c.dot(A)).dot(J_c)
    
    # find eigenvalues and eigenvectors
    eigen_val = la.eig(B)[0]
    eigen_vec = la.eig(B)[1].T
    
    # select top 2 dimensions (for example)
    PC1 = np.sqrt(eigen_val[0])*eigen_vec[0]
    PC2 = np.sqrt(eigen_val[1])*eigen_vec[1]