用不同的数据集训练相同的模型

时间:2021-03-12 02:42:57

标签: python loops append random-forest

我有几个具有不同数量预测变量的数据集,我想为不同的数据集训练一个具有相同参数的 RandomForestRegressor(),我得到了:

RF_grid = {
    'bootstrap': [True],
    'max_depth': [100],
    'max_features': ['auto'],
    'min_samples_leaf': [2],
    'min_samples_split': [5],
    }

RF = RandomForestRegressor()
RF_search = RandomizedSearchCV(RF,RF_grid,cv=3)

然后,得到相同拟合的不同数据集的追加:

rf1=[]
for r in list(range(0,number_of_datasets))
 rf1.append(RF_search.fit(np.array(train_data[r].iloc[:,3:train_data[r].shape[1]]).reshape(-1,train_data[r].shape[1]-3),np.array(train_data[r]['VAR_Y']).reshape(-1,1))) 
#the predictors starts from the third column

我希望有一个不同拟合的列表,每个列表都有不同数量的预测变量 (train_data[r].shape[1]),相反,我得到每个模型都有相同数量的预测变量,所以我无法预测,因为有些数据集有不同数量的预测变量。

是否有附加的替代方法,或者我做错了什么?谢谢!

0 个答案:

没有答案
相关问题