我已经在电信行业处理了churn
分析的输出,其格式如下:
labelsAndPredictions = testData.map(lambda lp: lp.label).zip(predictions)
如果我打印输出,输出如下:
[(0.0, 0.074), (0.0, 0.132),(1.0, 0.853),.....]
正如您所看到的,每个元素都有两个部分 - label
和prediction
。例如,第一个元素具有标签0.0
(或0),其预测为0.074
(换句话说,它有7%
个搅拌机会(或切换到其他网络))。我在训练模型时使用的功能是一组5种不同的功能。
现在我想使用ipython
或hostogram
在scatterplot
中可视化此输出(预测),但我很难理解如何在{{1}中绘制上述结果}或histogram
中的scatterplot