我在具有以下列的数据集上使用RandomForestRegressor:
此数据集的形状为50000,10
名为“ total”的列是标签(我正在预测),其余是功能。我将使用OneHotEncoder编码前四列,使用训练/测试拆分来拆分数据集,然后拟合RandomForestRegressor。
我的问题如下:
我想基于某个功能(即“ ballsRem”列)的值来预测测试集的准确性。该值的最小值为0,最大值为300,我想知道“ ballsRem”大于210的唯一预测的准确性。
我试图过滤test_features,如下所示,然后仅针对过滤后的集进行预测,但由于测试标签的过滤方式不同,因此我无法做出明智的预测
filteredTestingSet = test_features[test_features.ballsRem >= 180]
custprediction = predModel.predict(filteredTestingSet )
我该如何实现?