如何使用matplotlib
绘制多行(基于不同的应用)图表(x栏上的小时,y栏上的计数)和结果sparksql
?
我应该先将它转换为pandas数据帧吗?
结果是:
+---+------+---------------+
| hr|counts| app|
+---+------+---------------+
| 00| 1770| "BitTorrent"|
| 01| 2744| "BitTorrent"|
| 02| 2998| "BitTorrent"|
| 03| 13717| "BitTorrent"|
| 04| 417| "BitTorrent"|
| 10| 3497| "BitTorrent"|
| 11| 9037| "BitTorrent"|
| 00| 14| "DNS"|
| 01| 19| "DNS"|
| 02| 49| "DNS"|
| 03| 54| "DNS"|
| 10| 19| "DNS"|
| 11| 17| "DNS"|
| 00| 954| "HTTP.BROWSER"|
| 01| 1707| "HTTP.BROWSER"|
| 02| 15| "HTTP.BROWSER"|
+---+------+---------------+
还有一个问题是,我可以用不同的app填充结果中未显示的其他小时吗?