我有一个数据集(不是下面的数据集,而是类似的数据集),我试图从该数据集中用Python绘制条形图,以便可视化由不同类型的“插座类型”制成的“总销售额”
╔══════════╦════════════════════╦═══════╗
║ Location ║ Outlet_Type ║ Sales ║
╠══════════╬════════════════════╬═══════╣
║ Bandra ║ Supermarket Type 1 ║ 125 ║
║ Worli ║ Supermarket Type 2 ║ 150 ║
║ Wadala ║ Supermarket Type 3 ║ 100 ║
║ Chembur ║ Supermarket Type 2 ║ 100 ║
║ Kalina ║ Supermarket Type 3 ║ 110 ║
║ Dadar ║ Supermarket Type 3 ║ 115 ║
║ Korba ║ Supermarket Type 2 ║ 135 ║
║ Asavari ║ Supermarket Type 1 ║ 145 ║
╚══════════╩════════════════════╩═══════╝
因此,根据以上数据,我的条形图应显示在
上 X轴:“超市类型1”,“超市类型2”和“超市类型3”
Y轴:来自不同类型网点的总销售额
所以
“超市类型1”的值为270
“超市类型2”的价值为385
“超级市场类型3”的值为325
在SQL术语中,这类似于执行“分组依据”,但是在Python中,我无法这样做,而是暂时使用数据透视表。
data.pivot_table(values = 'Sales', index = 'Outlet_Type')
答案 0 :(得分:2)
您真的很亲密。您目前的方法只是缺少一个aggfunc
,所以pivot_table
不能相加:
import matplotlib.pyplot as plt
data.pivot_table(values = 'Sales', index = 'Outlet_Type', aggfunc='sum').plot(kind='bar')
plt.tight_layout()
plt.show()
答案 1 :(得分:1)