我是R的初学者,并且在预测功能上遇到了一些麻烦。
我使用h2o
构建了一个随机森林模型,其中y
为0/1(买入/不买入)。
然后,我尝试使用predict()
函数将模型应用于新数据集
例如:pre=predict(rf,test_data)
我可以看到如下所示的预测结果摘要:
> summary(pre)
predict p0 p1
0:998 Min. :0.0000 Min. :5.601e-05
1: 97 1st Qu.:0.9989 1st Qu.:5.601e-05
Median :0.9989 Median :5.601e-05
Mean :0.9150 Mean :8.498e-02
3rd Qu.:0.9989 3rd Qu.:5.601e-05
Max. :0.9999 Max. :1.000e+00
但是,我无法View()
作为列表预测结果。这是使用View(pre)
时得到的:
最终,我想知道哪一行预测为1(买入),哪一行预测为0(无买入)。有谁知道如何解决这个问题? 非常感谢!
答案 0 :(得分:0)
@ s.brunel有正确的答案。在编写带有二进制预测的例程时要记住,它将返回三个变量。而预测连续变量时,您会得到一个变量。
答案 1 :(得分:0)
发布答案以使其更容易找到。
如果要在H2OFrame上使用R函数,则首先需要将该H2OFrame转换为R框架,针对特定情况,您可以按照以下步骤进行操作:
pre_df <- as.data.frame(pre)
请注意,某些H2O函数使用与R函数相同的命名约定,因此尽管您可能认为summary()
函数是R函数,但实际上是H2O summary()
函数,其功能相同是R函数,但用于H2OFrame。