对于初学者而言,公制MDS和非公制MDS有什么区别?

时间:2019-11-30 17:15:59

标签: r data-science mds multi-dimensional-scaling

我对数据科学还很陌生,想用简单的语言(例如教您的祖母)来了解度量和非度量多维缩放之间的区别。

我已经谷歌搜索了2天,观看了不同的视频,并且无法完全理解人们用来描述差异的一些术语,也许我缺乏一些基本知识,但是我不知道在哪个领域因此,如果您对在处理该主题之前应该对自己有什么了解有一个了解,我将不胜感激。这是我所知道的:

多维缩放是缩小维度的一种方式,以便能够以更友好的方式可视化或表示数据。我知道MDS有多种方式,例如公制和非公制,PCA和FA(也许FA是PCA的一部分,我不确定)。

我尝试应用的示例是一组显示不同城市以及与这些城市相关的属性的数据。例如,在1到7(最低1-最高7)的分数上,这是每个城市和相应属性的分数。

          **Clean**      **Friendly**     **Expensive**     **Beautiful**          

柏林 ----------- 4 --------------------- 2 ----- ------------------ 5 ------------------------ 6

日内瓦 --------- 6 --------------------- 3 ------- ---------------- 7 ------------------------ 7

巴黎 ------------ 3 --------------------- 4 ---- ------------------- 6 ------------------------ 7

巴塞罗那 ----- 2 --------------------- 6 ----------- ------------ 3 ------------------------ 4

如何知道我应该使用公制还是非公制的MDS。是否有通用的经验法则或简单的逻辑可以用来决定而无需深入技术过程。

谢谢

1 个答案:

答案 0 :(得分:2)

好吧,我可能无法给您一个具体的答案,但是一个简单的答案是,度量标准MDS已经具有距离(即城市之间的实际距离)形式的输入矩阵,因此,距离在输入矩阵并从这些距离创建实际物理位置图。

在非度量MDS中,距离只是排名的一种表示形式(即,最高为7,最低为1),它们本身没有任何意义,但需要使用欧几里得来创建地图几何图形和地图,然后仅显示由地图上坐标之间的距离表示的等级相似度。