熊猫:来自客户订单的堆积条形图

时间:2017-11-09 22:21:50

标签: pandas matplotlib plot

我正在尝试从许多公司的客户订单上做一个堆积的情节栏。我想将每个订单显示为每个公司栏的一部分。问题是我公司的订单数量确定不确定,而且情节的显示可能会让我的笔记本电脑崩溃。

从概念上讲,我通过以下方式达到目标:

company1   = pd.Series([10,10,10])
company2   = pd.Series([20,20])
df         = pd.DataFrame([company1, company2]).T
df.columns = ["company1", "company2"]
df.T.plot.bar(stacked=True)

给我一​​个情节: enter image description here

现在我如何将其应用于我的数据集?

我在我的数据子集上尝试以下内容(p2中只有3家公司):

p3         = p2[["COMPANY", "TOTAL_PAID"]]
companies  = [company             for company, group in p3.groupby("COMPANY")]
series     = [group["TOTAL_PAID"] for company, group in p3.groupby("COMPANY")]
df         = pd.DataFrame(series).T
df.columns = companies
df.T.plot.bar(stacked=True, legend=False)

它有效:

enter image description here

但是当我将它应用于整个文件(仍然很小:15 k行)时我可以等很长时间才能得到任何结果(事实上我在启动绘图创建后写了整个问题,但它不是显示...),所以问题是:

  1. 这两个理解列表的概念是一个好策略吗?我觉得它有点不理想......
  2. 情节显示需要这么长时间是否正常?
  3. jupyter崩溃可能是正常的吗?

0 个答案:

没有答案