我正在开始一个数据分析项目,并且好奇最好的方法是处理以下场景:
1个结果变量(数字), 4个预测变量(全数字),
任何变量之间都没有关系(线性或非线性)
python中的数据集:
import pandas as pd
import numpy as np
pd.DataFrame( np.random.random([100,5])*100-50, columns=[['outcome','v1','v2','v3','v4']] )
寻求v1-v4的一个子集,最大化总和(结果),最少5个案例。 如果没有最小输出约束为5,我只是找到max(结果)和v1-v4的值,我会将它们用作我的过滤器。但由于我需要多个案例,我需要进行强力搜索,我认为这是分类数据的优化,如果这有意义的话。
进行此优化搜索的好方法是什么?
此外,如果有任何不清楚的地方,请发表评论。
本