问题:
关于美国大学排名的数据集包含1302所提供本科课程的美国大学的信息。对于每所大学,都有一系列衡量标准,包括连续测量(例如学费和毕业率)和分类测量(例如按州的位置以及是否是私立或公立学校)。使用数据集(Universities.csv)和R代码(uni)进行主成分分析(PCA)。
是否应该对数据进行规范化?如果可以,为什么?
这是我的答案:
是的。变量的度量单位并不常见。学费和毕业率是通过连续测量来衡量的,而私立或公立学校是通过分类测量来测量的。变量以不同单位度量,因此不清楚如何比较不同变量的变异性。