如何获得测试数据子集的回归模型的预测准确性?

时间:2020-10-13 18:22:30

标签: machine-learning random-forest predict train-test-split

我在具有以下列的数据集上使用RandomForestRegressor:

dataset before one hot encoding and separating features from label

此数据集的形状为50000,10

名为“ total”的列是标签(我正在预测),其余是功能。我将使用OneHotEncoder编码前四列,使用训练/测试拆分来拆分数据集,然后拟合RandomForestRegressor。

我的问题如下:

我想基于某个功能(即“ ballsRem”列)的值来预测测试集的准确性。该值的最小值为0,最大值为300,我想知道“ ballsRem”大于210的唯一预测的准确性。

我试图过滤test_features,如下所示,然后仅针对过滤后的集进行预测,但由于测试标签的过滤方式不同,因此我无法做出明智的预测

filteredTestingSet = test_features[test_features.ballsRem >= 180]

custprediction = predModel.predict(filteredTestingSet )

我该如何实现?

0 个答案:

没有答案
相关问题