Question

我有几个具有不同数量预测变量的数据集，我想为不同的数据集训练一个具有相同参数的 RandomForestRegressor()，我得到了：

RF_grid = {
    'bootstrap': [True],
    'max_depth': [100],
    'max_features': ['auto'],
    'min_samples_leaf': [2],
    'min_samples_split': [5],
    }

RF = RandomForestRegressor()
RF_search = RandomizedSearchCV(RF,RF_grid,cv=3)

然后，得到相同拟合的不同数据集的追加：

rf1=[]
for r in list(range(0,number_of_datasets))
 rf1.append(RF_search.fit(np.array(train_data[r].iloc[:,3:train_data[r].shape[1]]).reshape(-1,train_data[r].shape[1]-3),np.array(train_data[r]['VAR_Y']).reshape(-1,1))) 
#the predictors starts from the third column

我希望有一个不同拟合的列表，每个列表都有不同数量的预测变量 (train_data[r].shape[1])，相反，我得到每个模型都有相同数量的预测变量，所以我无法预测，因为有些数据集有不同数量的预测变量。

是否有附加的替代方法，或者我做错了什么？谢谢！

用不同的数据集训练相同的模型

0 个答案: