我有几个具有不同数量预测变量的数据集,我想为不同的数据集训练一个具有相同参数的 RandomForestRegressor(),我得到了:
RF_grid = {
'bootstrap': [True],
'max_depth': [100],
'max_features': ['auto'],
'min_samples_leaf': [2],
'min_samples_split': [5],
}
RF = RandomForestRegressor()
RF_search = RandomizedSearchCV(RF,RF_grid,cv=3)
然后,得到相同拟合的不同数据集的追加:
rf1=[]
for r in list(range(0,number_of_datasets))
rf1.append(RF_search.fit(np.array(train_data[r].iloc[:,3:train_data[r].shape[1]]).reshape(-1,train_data[r].shape[1]-3),np.array(train_data[r]['VAR_Y']).reshape(-1,1)))
#the predictors starts from the third column
我希望有一个不同拟合的列表,每个列表都有不同数量的预测变量 (train_data[r].shape[1]),相反,我得到每个模型都有相同数量的预测变量,所以我无法预测,因为有些数据集有不同数量的预测变量。
是否有附加的替代方法,或者我做错了什么?谢谢!