我正在使用Spark with R来创建RandomForest模型(spark.randomForest),然后预测测试数据的标签(分类)。我遇到的问题是我不仅需要带有标签/预测的'预测'列,而且我还需要'probability'列才能将其导出/保存到文件中,'csv'会很棒,但是以可读的格式。从我所读到的,“概率”列似乎是一个S4向量,到目前为止,我无法将其转换为任何可读的双/字符串。结果数据框当然是Spark DataFrame。
由于项目限制,我主要使用'SparkR'库。
有人能指出我正确的方向吗? TIA。