PuLP:每组仅使用一个项目

时间:2016-09-01 14:54:14

标签: python pandas constraints solver pulp

我有一个Pandas数据框,其中包含以下值:

     Name    Age    City    Points
1    John    24     CHI     35
2    Mary    18     NY      25
.
.
80   Steve   30     CHI     32

我正在努力组建一个最大化积分总和的5人组。我想有两个限制:年龄和城市。最高年龄必须在110岁以下,并且不能有两个人来自同一个城市。

目前我有一个脚本可以最大化积分并考虑年龄限制:

x = pulp.LpVariable.dicts("x", df.index, cat='Integer', lowBound=0)
mod = pulp.LpProblem("prog", pulp.LpMaximize)

objvals_p = {idx: (df['Points'][idx]) for idx in df.index}
mod += sum([x[idx]*objvals_p[idx] for idx in df.index])

objvals_a = {idx: (df['Age'][idx]) for idx in df.index}
mod += pulp.lpSum([x[idx]*objvals_a[idx] for idx in df.index]) < 110

但是我无法弄清楚如何在我的脚本中添加城市约束。

对我有什么建议吗?

谢谢!

1 个答案:

答案 0 :(得分:2)

您可以这样做:

for city in df['City'].unique():
    sub_idx = df[df['City']==city].index
    mod += pulp.lpSum([x[idx] for idx in sub_idx]) <= 1

对于DataFrame中的每个城市,此总和超过DataFrame的子集(由sub_idx索引),此总和应小于或等于1,因为来自同一城市的2个人不能加入团队。

要使此(和您的其他约束)起作用,您需要更改决策变量的定义。它应该是二进制的;完整性是不够的。

x = pulp.LpVariable.dicts("x", df.index, 0, 1, pulp.LpInteger)