我有一个包含Week,Campaign,Placement和Count列的数据框。
为了比较“广告系列”和“展示位置”的每周计数,我创建了一个很好的数据透视表。如何创建一个新的列,其前两周的时间差(如果可能,以百分比表示)?
代码:
dfPivot = pd.pivot_table(dfPivot, values='Count',\
index=['Campaign', 'Placement'],columns=['Week'], aggfunc=np.sum)
当前输出:
Week 2019-10-27 2019-11-03
Campaign Placement Code
A 111111111 4288.0 615.0
111111112 243.0 11.0
111111113 598.0 30.0
111111114 1041.0 377.0
111111115 7759.0 161.0
B 111111111 1252.0 241.0
111111112 643.0 124.0
111111113 135.0 30.0
111111114 8753.0 2327.0
111111115 7242.0 112.0
预期输出:
Week 2019-10-27 2019-11-03 Difference
Campaign Placement Code
A 111111111 4288.0 615.0 -85.7%
111111112 243.0 11.0 -95.4%
111111113 598.0 30.0 -94.9%
111111114 1041.0 377.0 [...]
111111115 7759.0 161.0 [...]
B 111111111 1252.0 241.0 [...]
111111112 643.0 124.0 [...]
111111113 135.0 30.0 [...]
111111114 8753.0 2327.0 [...]
111111115 7242.0 112.0 [...]
谢谢!
答案 0 :(得分:1)
使用DataFrame.pct_change
来选择位置的最后一行,并用100
来乘以百分比:
df['diff'] = df.pct_change(axis=1).iloc[:, -1].mul(100)
print (df)
2019-10-27 2019-11-03 diff
Campaign Placement Code
A 111111111 4288.0 615.0 -85.657649
111111112 243.0 11.0 -95.473251
111111113 598.0 30.0 -94.983278
111111114 1041.0 377.0 -63.784822
111111115 7759.0 161.0 -97.924990
B 111111111 1252.0 241.0 -80.750799
111111112 643.0 124.0 -80.715397
111111113 135.0 30.0 -77.777778
111111114 8753.0 2327.0 -73.414829
111111115 7242.0 112.0 -98.453466