R在谱聚类中归一化特征向量然后绘制

时间:2014-01-17 07:05:14

标签: r plot cluster-analysis eigenvector normalize

我正在关注此http://www.pnas.org/content/suppl/2008/12/22/0802806106.DCSupplemental/0802806106SI.pdf以在spectral clustering上实现correlation matrix。我已经计算了eigenvalues/vectors并选择了k-most(k=5)重要对。结果矩阵如下所示:

    V1      V2      V3      V4      V5
-0.033  -0.099  -0.046  -0.014  -0.013
-0.010   0.012   0.069   0.087   0.002
 0.010  -0.002   0.114  -0.053  -0.012
0.0023   0.001  -0.013  -0.006  -0.005
 0.004   0.054  -0.011   0.090  -0.049

现在我需要"normalize each row to unit length"。我该怎么做?根据我的理解,我通过将行平方中每个值的总和的平方根作为|a|计算每行的长度,然后将行中的每个值除以|a|

如果是这种情况,我将如何在Euclidean Space? 5D plot?中绘制这5个值。我发现在网络上的大多数资源都与规范化单位长度有关{{1}并且可以在x,y,z上绘制。

感谢。

1 个答案:

答案 0 :(得分:1)

如果您的假设是正确的,那么您需要

df_rn <- df / rowSums(sqrt(df^2))
rowSums(df_rn^2)
[1] 1 1 1 1 1

因此所有行现在都按其l2(欧几里德)长度进行归一化。

在5d中可以说关于密谋的说法不多:这是不可能的。通常绘制2d(很少-3d)投影。投影平面的问题是开放的;这取决于你想要展示的是什么。