我应该何时规范化数据?

时间:2018-07-19 07:44:33

标签: bigdata data-mining data-science

问题:

关于美国大学排名的数据集包含1302所提供本科课程的美国大学的信息。对于每所大学,都有一系列衡量标准,包括连续测量(例如学费和毕业率)和分类测量(例如按州的位置以及是否是私立或公立学校)。使用数据集(Universities.csv)和R代码(uni)进行主成分分析(PCA)。

是否应该对数据进行规范化?如果可以,为什么?

这是我的答案:

是的。变量的度量单位并不常见。学费和毕业率是通过连续测量来衡量的,而私立或公立学校是通过分类测量来测量的。变量以不同单位度量,因此不清楚如何比较不同变量的变异性。

Importance of components Correlation

0 个答案:

没有答案