使用pandas汇总和绘制数据

时间:2016-11-01 22:38:00

标签: python pandas

我想使用pandas来总结或可视化我的数据中的一些有用的摘要,以突出供应商如何偏离供应的日期订单。这是我的数据框的片段:

Supplier    TimeDiff (days)
A   3 days
B   4 days
B   12 days
A   0 days
C   1 days
B   2 days
D   3 days
E   5 days
E   7 days

“供应商”列包含供应商代码,“TimeDiff”列包含时差(通过从“订单接收日期”中扣除“订单到期日”获得的日期范围)。

有谁知道如何最好地总结这些数据?感谢

1 个答案:

答案 0 :(得分:2)

我首先要按供应商计算平均TimeDiff:

import matplotlib.pyplot as plt
import pandas as pd

df = pd.DataFrame([['A', '3 days'], ['B', '4 days'], ['B', '12 days'], ['A', '0 days']], columns=['Supplier', 'TimeDiff'])
df['TimeDiff'] = df['TimeDiff'].str.extract(r'(\d+)').astype(int)
print df.groupby('Supplier').mean()

          TimeDiff
Supplier          
A              1.5
B              8.0

res.plot.bar()
plt.show()

enter image description here