我正在寻找一种通过多个约束来最小化成本的方法,方法是从包含每个选项的组的大型数据集中为每个组选择一个选项。该数据集由大约100个组组成,每个组有200个选项。
下面列出了优化的条件,数据的示例以及结果应该是什么。在小型数据集上,我只是在所有组合上循环,但是使用实际的大型数据集,这将永远需要。我查看了SciPy Optimize Minimize,但这似乎不合适。是否存在可用于找到最低成本的现有优化框架?如果没有,在Python中解决它的好方法是什么?
条件
数据集
+-------+--------+-----+-----+-------+
| Group | Option | A | B | Costs |
+-------+--------+-----+-----+-------+
| 1 | 1 | 10 | 0 | 10 |
| 1 | 2 | 0 | 0 | 21 |
| 1 | 3 | 0 | 7 | 15 |
| 2 | 1 | 8 | 0 | 8 |
| 2 | 2 | 0 | 0 | 34 |
| 2 | 3 | 0 | 5 | 18 |
| 3 | 1 | 9 | 0 | 9 |
| 3 | 2 | 0 | 0 | 20 |
| 3 | 3 | 0 | 6 | 7 |
+-------+--------+-----+-----+-------+
结果
+-------+--------+
| Group | Option |
+-------+--------+
| 1 | 1 |
| 2 | 3 |
| 3 | 3 |
+-------+--------+
Total costs: 35
Sum A: 10
Sum B: 11
答案 0 :(得分:0)
这是使用CVXPY(http://www.cvxpy.org/en/latest/index.html)的解决方案。 我安排了数据,A,B,成本是矩阵,列 i 代表 i 组的选项。
import cvxpy as cvx
import numpy as np
A = np.array([[10,8,9],[0,0,0],[0,0,0]])
B = np.array([[0,0,0],[0,0,0],[7,5,6]])
cost = np.array([[10,21,15],[8,34,18],[9,20,7]]).T
choices = cvx.Int(3,3)
constraints = [cvx.sum_entries(choices[:,i]) == 1 for i in range(3)] + [cvx.sum_entries(cvx.mul_elemwise(A,choices)) <= 10] + [cvx.sum_entries(cvx.mul_elemwise(B,choices)) <= 12] + [choices >= 0, choices <= 1]
objective = cvx.Minimize(cvx.sum_entries(cvx.mul_elemwise(cost,choices)))
prob = cvx.Problem(objective,constraints)
prob.solve()
print(int(round(prob.value)))
print(np.matrix(prob.variables()[0].value.round(),dtype = np.int))
由于某种原因,输出值仍然是浮点数,所以我将它们转换回整数。