两个不同矩阵的特征向量的余弦相似性

时间:2014-09-22 10:13:32

标签: matrix linear-algebra eigenvector cosine-similarity

找到两个非常大的矩阵的特征向量的余弦相似性来比较它们的相似程度是否是一个有效的度量?

我有两个非常大的矩阵A和B.我发现:

- > Co-Variance矩阵C A 和C B

- > C A 和C B 的前20个特征向量,

- >前20个特征向量之间的余弦相似性。

基于余弦值判断矩阵A和B是相似/不相似的,是否正确?

1 个答案:

答案 0 :(得分:1)

简答:不,你当然还要考虑特征值。

如果你认为一个正方形的N×N矩阵作为将N矢量映射到N矢量的线性算子,矩阵对这种矢量空间的作用受到矩阵的整个谱结构的强烈影响:特征向量和相关的特征值。

最大的特征值通常是最重要的,因为它们代表了矩阵更敏感的N向量空间中的方向(特征向量)。

在一个好的情况下,大矩阵的光谱(即其特征值集合)可以很好地分成几个最大的特征值和大量的小特征值。在这种情况下,可以基于这样的主要特征值集合和相关联的特征向量来定义相似性度量。

以我自己的经验为例,对于弹性结构建模所产生的矩阵,这确实是典型的情况,因为主要的特征值/特征向量“凝聚”了弹性结构的整体性质。

这就是说,特定病例的病理状况可能会有多严重。 这在很大程度上取决于所考虑的具体问题,在我看来,对“矩阵相似性”的自信假设很大程度上取决于物理洞察力 关于这个问题。

定义“相似”矩阵的其他常用标准基于奇异值分解(SVD)或主成分分析(PCA)。