我想使用pandas来总结或可视化我的数据中的一些有用的摘要,以突出供应商如何偏离供应的日期订单。这是我的数据框的片段:
Supplier TimeDiff (days)
A 3 days
B 4 days
B 12 days
A 0 days
C 1 days
B 2 days
D 3 days
E 5 days
E 7 days
“供应商”列包含供应商代码,“TimeDiff”列包含时差(通过从“订单接收日期”中扣除“订单到期日”获得的日期范围)。
有谁知道如何最好地总结这些数据?感谢
答案 0 :(得分:2)
我首先要按供应商计算平均TimeDiff:
import matplotlib.pyplot as plt
import pandas as pd
df = pd.DataFrame([['A', '3 days'], ['B', '4 days'], ['B', '12 days'], ['A', '0 days']], columns=['Supplier', 'TimeDiff'])
df['TimeDiff'] = df['TimeDiff'].str.extract(r'(\d+)').astype(int)
print df.groupby('Supplier').mean()
TimeDiff
Supplier
A 1.5
B 8.0
res.plot.bar()
plt.show()