我正在尝试从许多公司的客户订单上做一个堆积的情节栏。我想将每个订单显示为每个公司栏的一部分。问题是我公司的订单数量确定不确定,而且情节的显示可能会让我的笔记本电脑崩溃。
从概念上讲,我通过以下方式达到目标:
company1 = pd.Series([10,10,10])
company2 = pd.Series([20,20])
df = pd.DataFrame([company1, company2]).T
df.columns = ["company1", "company2"]
df.T.plot.bar(stacked=True)
现在我如何将其应用于我的数据集?
我在我的数据子集上尝试以下内容(p2中只有3家公司):
p3 = p2[["COMPANY", "TOTAL_PAID"]]
companies = [company for company, group in p3.groupby("COMPANY")]
series = [group["TOTAL_PAID"] for company, group in p3.groupby("COMPANY")]
df = pd.DataFrame(series).T
df.columns = companies
df.T.plot.bar(stacked=True, legend=False)
它有效:
但是当我将它应用于整个文件(仍然很小:15 k行)时我可以等很长时间才能得到任何结果(事实上我在启动绘图创建后写了整个问题,但它不是显示...),所以问题是: