如何使用ipython中的hostogram或scatterplot可视化电信客户流失分析

时间:2015-08-11 04:41:37

标签: machine-learning ipython histogram scatter-plot pyspark

我已经在电信行业处理了churn分析的输出,其格式如下:

labelsAndPredictions = testData.map(lambda lp: lp.label).zip(predictions)

如果我打印输出,输出如下:

[(0.0, 0.074), (0.0, 0.132),(1.0, 0.853),.....]

正如您所看到的,每个元素都有两个部分 - labelprediction。例如,第一个元素具有标签0.0(或0),其预测为0.074(换句话说,它有7%个搅拌机会(或切换到其他网络))。我在训练模型时使用的功能是一组5种不同的功能。

现在我想使用ipythonhostogramscatterplot中可视化此输出(预测),但我很难理解如何在{{1}中绘制上述结果}或histogram中的scatterplot

0 个答案:

没有答案