处理ml_random_forest中看不见的标签

时间:2018-07-02 20:08:02

标签: r sparklyr

我正在使用R / Spark / sparklyr开发随机森林模型。我使用ml_random_forest,一切正常,直到尝试对新数据集进行预测并发现某些字符串变量具有原始数据集中不存在的值,并得到包含

的错误。
Caused by: org.apache.spark.SparkException: Unseen label: ZZZZZZ.  To handle unseen labels, set Param handleInvalid to keep.

但是我在R帮助(找不到一些scala)中找不到handleInvalid参数或如何使用它。在哪里可以找到文档?

0 个答案:

没有答案