Rglpk Package(R) - Fantasy Sports Optimiser - 高级步骤

时间:2017-02-21 00:58:45

标签: r linear-programming

我有一个数据框(统计数据),其结构如下:

   Pos        Player.Name   TM   Sal  R1  R2  R3  R4  R5  R6  R7  R8  R9 R10 R11 R12 R16 R17 R18 R19 R20 R21 R22 R23     FP
1  MID        Blake Acres  STK 11200  83   0   0  41   0 126  49  35   0   0   0  71  32  65  46  91  82  99 121  66  71.92
2  FWD      Jack Billings  STK 12100  74  59 122 113  46  88  81  76  80   0  60   0   0  74  63  85  99  52 105  72  79.35
3  FWD         Josh Bruce  STK  9250  59  81  72  55  59  69  47  43 112  60  57  59  71  65  26  48 104  49  41  69  62.30
5  DEF      Sean Dempster  STK  8650  42  47  62  79  44  42  65  57  52  62  24   0  21  48  97  40  80  71  81  54  56.21

我可以按照以下方式运行简单的Rglpk阵容优化,完全没有任何问题,它会根据统计数据给出最佳阵容$ FP

num.players <- length(stats$Player.Name)
obj <- stats$FP
var.types <- rep("B", num.players)
names<-unique(stats$Player.Name)
mat<-matrix(0, nrow = length(names), ncol = nrow(stats))
for (i in 1:length(names)){mat[i,]<-as.numeric(stats$Player.Name == names[i])}
matrix <- rbind(as.numeric(stats$Pos == "DEF"),as.numeric(stats$Pos == "MID"),as.numeric(stats$Pos == "RK"),as.numeric(stats$Pos == "FWD"),stats$Sal)
matrix<-rbind(mat,matrix)
direction <- c(rep("<=",length(names)),"==","==","==","==","<=") 
rhs <- c(rep(1,length(names)),2,4,1,2,100000)             
sol <- Rglpk_solve_LP(obj = obj, mat = matrix, dir = direction, rhs = rhs,types = var.types, max = TRUE)
Lineup<-stats[sol$solution==1,]

但是,我想修改此代码,以便找到一个在指定轮次中达到指定分数的最佳边(即统计数据$ R1到统计数据$ R23)。我已经把一个循环方法放在一起,这个方法在理论上有效,但是太慢而不实用:

target<-readline("Enter target score: ")
gms_target<-as.numeric(readline("Enter number of games to reach target score (out of 20): "))

pass<-"N"
avg<-2000

while (pass == "N"){
num.players <- length(stats$Player.Name)
obj <- stats$FP
var.types <- rep("B", num.players)
names<-unique(stats$Player.Name)
mat<-matrix(0, nrow = length(names), ncol = nrow(stats))
for (i in 1:length(names)){mat[i,]<-as.numeric(stats$Player.Name == names[i])}
matrix <- rbind(as.numeric(stats$Pos == "DEF"),as.numeric(stats$Pos == "MID"),as.numeric(stats$Pos == "RK"),as.numeric(stats$Pos == "FWD"),stats$Sal,stats$FP)
matrix<-rbind(mat,matrix)
direction <- c(rep("<=",length(names)),"==","==","==","==","<=","<=") 
rhs <- c(rep(1,length(names)),2,4,1,2,100000,avg)             
sol <- Rglpk_solve_LP(obj = obj, mat = matrix, dir = direction, rhs = rhs,types = var.types, max = TRUE)

Lineup<-stats[sol$solution==1,]
Salary<-sum(Lineup$Sal)
Score<-sum(Lineup$FP)
avg<-Score-.05
sums<-colSums(Lineup[,c(5:24)])
gms<-length(sums[sums >= target])
if(gms>=gms_target){pass="Y"}
}

有没有一种简单的方法可以将此请求构建到标准的Rglpk框架中? 例如,找到最佳阵容(根据统计数据$ FP),该队在R1和R23之间的20场比赛中至少有5场得分为500分?

------------------------------ UPDATE ---------------- --------------

我正在考虑更多这方面的内容,并将统计数据$ FP从平均分数更新到循环中的总赛季分数,大大减少了循环运行时间,但是,我仍然对非循环非常感兴趣替代品。

1 个答案:

答案 0 :(得分:0)

您可能需要查看R中的分布函数。如果您可以找到优化团队的均值和标准差,则可以计算团队使用pnorm()达到指定分数的可能性。我实际上将它用于我的幻想玩家,看看他们为我返回一定分数的可能性。这是我的代码示例。

players$lk = mapply(function(x,y,z) pnorm(q=z, mean=x, sd=y, lower.tail = FALSE), x=players$points, y=players$sd, z=players$projection) -players $ points是他们的平均预测 -players $ sd是他们的标准偏差 -players $ projection是我希望他们打的数字

如果可以计算标准差,则可以为团队使用相同的分布函数。