这很可能是一个愚蠢的问题,但是作为Python / Numpy的初学者,我还是会问。我遇到了很多有关如何在numpy中规范化数组/矩阵的帖子。但是我不确定为什么。为什么/何时需要在numpy中对数组/矩阵进行规范化?什么时候使用?
Normalize在差异上下文中可以有多种含义。我的问题属于数据分析/数据科学领域。在这种情况下,规范化是什么意思?或者更具体地说,在什么情况下应该规范化数组?
该问题的第二部分是-标准化的方法有哪些,可以在所有情况下互换使用吗?
第三部分也是最后一部分-规范化可以用于任何尺寸的数组吗?
将链接到任何参考材料(对于初学者)。
答案 0 :(得分:2)
考虑尝试对具有两个数字属性A和B的对象进行聚类。两者同等重要。属性A的范围可以从0到1000,属性B的范围可以从0到5。
如果不对A和B进行归一化,则在应用任何标准距离度量标准时,属性A最终将完全超过属性B。