我有一个数据框(统计数据),其结构如下:
Pos Player.Name TM Sal R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R16 R17 R18 R19 R20 R21 R22 R23 FP
1 MID Blake Acres STK 11200 83 0 0 41 0 126 49 35 0 0 0 71 32 65 46 91 82 99 121 66 71.92
2 FWD Jack Billings STK 12100 74 59 122 113 46 88 81 76 80 0 60 0 0 74 63 85 99 52 105 72 79.35
3 FWD Josh Bruce STK 9250 59 81 72 55 59 69 47 43 112 60 57 59 71 65 26 48 104 49 41 69 62.30
5 DEF Sean Dempster STK 8650 42 47 62 79 44 42 65 57 52 62 24 0 21 48 97 40 80 71 81 54 56.21
我可以按照以下方式运行简单的Rglpk阵容优化,完全没有任何问题,它会根据统计数据给出最佳阵容$ FP
num.players <- length(stats$Player.Name)
obj <- stats$FP
var.types <- rep("B", num.players)
names<-unique(stats$Player.Name)
mat<-matrix(0, nrow = length(names), ncol = nrow(stats))
for (i in 1:length(names)){mat[i,]<-as.numeric(stats$Player.Name == names[i])}
matrix <- rbind(as.numeric(stats$Pos == "DEF"),as.numeric(stats$Pos == "MID"),as.numeric(stats$Pos == "RK"),as.numeric(stats$Pos == "FWD"),stats$Sal)
matrix<-rbind(mat,matrix)
direction <- c(rep("<=",length(names)),"==","==","==","==","<=")
rhs <- c(rep(1,length(names)),2,4,1,2,100000)
sol <- Rglpk_solve_LP(obj = obj, mat = matrix, dir = direction, rhs = rhs,types = var.types, max = TRUE)
Lineup<-stats[sol$solution==1,]
但是,我想修改此代码,以便找到一个在指定轮次中达到指定分数的最佳边(即统计数据$ R1到统计数据$ R23)。我已经把一个循环方法放在一起,这个方法在理论上有效,但是太慢而不实用:
target<-readline("Enter target score: ")
gms_target<-as.numeric(readline("Enter number of games to reach target score (out of 20): "))
pass<-"N"
avg<-2000
while (pass == "N"){
num.players <- length(stats$Player.Name)
obj <- stats$FP
var.types <- rep("B", num.players)
names<-unique(stats$Player.Name)
mat<-matrix(0, nrow = length(names), ncol = nrow(stats))
for (i in 1:length(names)){mat[i,]<-as.numeric(stats$Player.Name == names[i])}
matrix <- rbind(as.numeric(stats$Pos == "DEF"),as.numeric(stats$Pos == "MID"),as.numeric(stats$Pos == "RK"),as.numeric(stats$Pos == "FWD"),stats$Sal,stats$FP)
matrix<-rbind(mat,matrix)
direction <- c(rep("<=",length(names)),"==","==","==","==","<=","<=")
rhs <- c(rep(1,length(names)),2,4,1,2,100000,avg)
sol <- Rglpk_solve_LP(obj = obj, mat = matrix, dir = direction, rhs = rhs,types = var.types, max = TRUE)
Lineup<-stats[sol$solution==1,]
Salary<-sum(Lineup$Sal)
Score<-sum(Lineup$FP)
avg<-Score-.05
sums<-colSums(Lineup[,c(5:24)])
gms<-length(sums[sums >= target])
if(gms>=gms_target){pass="Y"}
}
有没有一种简单的方法可以将此请求构建到标准的Rglpk框架中? 例如,找到最佳阵容(根据统计数据$ FP),该队在R1和R23之间的20场比赛中至少有5场得分为500分?
------------------------------ UPDATE ---------------- --------------
我正在考虑更多这方面的内容,并将统计数据$ FP从平均分数更新到循环中的总赛季分数,大大减少了循环运行时间,但是,我仍然对非循环非常感兴趣替代品。
答案 0 :(得分:0)
您可能需要查看R中的分布函数。如果您可以找到优化团队的均值和标准差,则可以计算团队使用pnorm()达到指定分数的可能性。我实际上将它用于我的幻想玩家,看看他们为我返回一定分数的可能性。这是我的代码示例。
players$lk = mapply(function(x,y,z) pnorm(q=z, mean=x, sd=y, lower.tail = FALSE), x=players$points, y=players$sd, z=players$projection)
-players $ points是他们的平均预测
-players $ sd是他们的标准偏差
-players $ projection是我希望他们打的数字
如果可以计算标准差,则可以为团队使用相同的分布函数。