这是我的考试任务。假设我有一个200x6的矩阵,其中有200个人就6个问题投了一部电影,每个问题都是连续的[0,1] - 尺度(0:不同意,1:同意)。 为了获得有用的6维数据集概述,我想绘制数据的秩-2近似值。首先,我做了等级2近似:
A = (200, 6); %some data
[U, S, V] = svd(A);
Ak = U(:, 1:2) * S(1:2, 1:2) * V(:, 1:2)';
我想将此近似值绘制为带有“*”的2D散点图 - 每个调查参与者使用U或V坐标作为中间坐标,这取决于我的数据的组织方式。问题是我不知道中间坐标是什么意思,我无法在任何地方找到一个好的解释。想知道是否有人可以帮助,最终提供一个小代码示例。感谢任何帮助,谢谢。
答案 0 :(得分:0)
正式地,中间轴是(正交)数据的线性组合(沿最大解释方差,a.k.a。主成分)。
如果大多数数据具有相似的形状(例如[5 4 3 2 1 0]模式),那么第一个组件将类似于此形状/向量,因为方差是最小的(或者:沿着它的方差是最大)。下一个组件也会最小化正交平面中的其余方差。
所以,答案是:主要组成部分1和2 。
更准确地说:第一个中间坐标值可以理解为单个数据样本中“第一主模式”的大小。