基于主成分得分的排名

时间:2018-07-31 06:58:51

标签: r components pca analysis principal

我有一个2012年IPL板球锦标赛的数据集,我正在对此进行主成分分析。我需要使用主成分分数对玩家进行排名。 请帮忙。我附上示例代码和数据集的前几行,请让我如何根据PC1进行排名

Name           Runs Ave     SR      Fours   Sixes   HF
CH Gayle       733  61.08   160.74  46      59      9
G Gambhir      590  36.87   143.55  64      17      6
V Sehwag       495  33      161.23  57      19      5
CL White       479  43.54   149.68  41      20      5
S Dhawan       569  40.64   129.61  58      18      5
AM Rahane      560  40      129.33  73      10      5
KP Pietersen   305  61      147.34  22      20      3
RG Sharma      433  30.92   126.6   39      18      5
AB de Villiers 319  39.87   161.11  26      15      3

代码:

library(corpcor)
library(GPArotation)
library(psych)
library(ggplot2)
library(ggfortify)
library(nFactors)
library(dplyr)
library(expm)
library(Hmisc)

iplbatting <- read.csv("batting_bowling_ipl_bat.csv", header = TRUE)

str(iplbatting)

summary(iplbatting)

iplbatdata<-iplbatting[2:7]

summary(iplbatdata)
pairs.panels(iplbatdata,
             gap = 0,
             pch = 21)

#correlation matrix
corrmatrix <- cor(iplbatdata,use = "complete.obs")
corrmatrix

print(cortest.bartlett(corrmatrix, nrow(iplbatdata)))
A<-eigen(corrmatrix)
eigenvectors<-A$vectors
eigenvalues<-A$values
D<-diag(eigenvalues)
eigenvectors
eigenvalues
baloadings<-as.matrix(eigenvectors)
baloadings
plot(eigenvalues, type="lines", xlab="Principal Components ", ylab="Eigen Values")
part.pca <- eigenvalues/sum(eigenvalues)*100
print(part.pca)
print(cumsum(part.pca)

0 个答案:

没有答案