使用数据框

时间:2017-09-30 04:48:42

标签: python pandas spark-dataframe

如何使用matplotlib绘制多行(基于不同的应用)图表(x栏上的小时,y栏上的计数)和结果sparksql

我应该先将它转换为pandas数据帧吗?

结果是:

+---+------+---------------+
| hr|counts|            app|
+---+------+---------------+
| 00|  1770|   "BitTorrent"|
| 01|  2744|   "BitTorrent"|
| 02|  2998|   "BitTorrent"|
| 03| 13717|   "BitTorrent"|
| 04|   417|   "BitTorrent"|
| 10|  3497|   "BitTorrent"|
| 11|  9037|   "BitTorrent"|
| 00|    14|          "DNS"|
| 01|    19|          "DNS"|
| 02|    49|          "DNS"|
| 03|    54|          "DNS"|
| 10|    19|          "DNS"|
| 11|    17|          "DNS"|
| 00|   954| "HTTP.BROWSER"|
| 01|  1707| "HTTP.BROWSER"|
| 02|    15| "HTTP.BROWSER"|
+---+------+---------------+

还有一个问题是,我可以用不同的app填充结果中未显示的其他小时吗?

0 个答案:

没有答案