我有一个2012年IPL板球锦标赛的数据集,我正在对此进行主成分分析。我需要使用主成分分数对玩家进行排名。 请帮忙。我附上示例代码和数据集的前几行,请让我如何根据PC1进行排名
Name Runs Ave SR Fours Sixes HF
CH Gayle 733 61.08 160.74 46 59 9
G Gambhir 590 36.87 143.55 64 17 6
V Sehwag 495 33 161.23 57 19 5
CL White 479 43.54 149.68 41 20 5
S Dhawan 569 40.64 129.61 58 18 5
AM Rahane 560 40 129.33 73 10 5
KP Pietersen 305 61 147.34 22 20 3
RG Sharma 433 30.92 126.6 39 18 5
AB de Villiers 319 39.87 161.11 26 15 3
代码:
library(corpcor)
library(GPArotation)
library(psych)
library(ggplot2)
library(ggfortify)
library(nFactors)
library(dplyr)
library(expm)
library(Hmisc)
iplbatting <- read.csv("batting_bowling_ipl_bat.csv", header = TRUE)
str(iplbatting)
summary(iplbatting)
iplbatdata<-iplbatting[2:7]
summary(iplbatdata)
pairs.panels(iplbatdata,
gap = 0,
pch = 21)
#correlation matrix
corrmatrix <- cor(iplbatdata,use = "complete.obs")
corrmatrix
print(cortest.bartlett(corrmatrix, nrow(iplbatdata)))
A<-eigen(corrmatrix)
eigenvectors<-A$vectors
eigenvalues<-A$values
D<-diag(eigenvalues)
eigenvectors
eigenvalues
baloadings<-as.matrix(eigenvectors)
baloadings
plot(eigenvalues, type="lines", xlab="Principal Components ", ylab="Eigen Values")
part.pca <- eigenvalues/sum(eigenvalues)*100
print(part.pca)
print(cumsum(part.pca)