Question

我有一个包含Week，Campaign，Placement和Count列的数据框。

为了比较“广告系列”和“展示位置”的每周计数，我创建了一个很好的数据透视表。如何创建一个新的列，其前两周的时间差（如果可能，以百分比表示）？

代码：

dfPivot = pd.pivot_table(dfPivot, values='Count',\
                           index=['Campaign', 'Placement'],columns=['Week'], aggfunc=np.sum)

当前输出：

                      Week  2019-10-27  2019-11-03
Campaign    Placement Code      
A              111111111        4288.0    615.0
               111111112         243.0    11.0
               111111113         598.0    30.0
               111111114        1041.0    377.0
               111111115        7759.0    161.0
B              111111111        1252.0    241.0
               111111112         643.0    124.0
               111111113         135.0    30.0
               111111114        8753.0    2327.0
               111111115        7242.0    112.0

预期输出：

                      Week  2019-10-27  2019-11-03  Difference
Campaign    Placement Code      
A              111111111        4288.0    615.0     -85.7%
               111111112         243.0    11.0      -95.4%
               111111113         598.0    30.0      -94.9%
               111111114        1041.0    377.0     [...]
               111111115        7759.0    161.0     [...]
B              111111111        1252.0    241.0     [...]
               111111112         643.0    124.0     [...]
               111111113         135.0    30.0      [...]
               111111114        8753.0    2327.0    [...]
               111111115        7242.0    112.0     [...]

谢谢！

Answer 1

使用DataFrame.pct_change来选择位置的最后一行，并用100来乘以百分比：

df['diff'] = df.pct_change(axis=1).iloc[:, -1].mul(100)
print (df)
                         2019-10-27  2019-11-03       diff
Campaign Placement Code                                   
A        111111111           4288.0       615.0 -85.657649
         111111112            243.0        11.0 -95.473251
         111111113            598.0        30.0 -94.983278
         111111114           1041.0       377.0 -63.784822
         111111115           7759.0       161.0 -97.924990
B        111111111           1252.0       241.0 -80.750799
         111111112            643.0       124.0 -80.715397
         111111113            135.0        30.0 -77.777778
         111111114           8753.0      2327.0 -73.414829
         111111115           7242.0       112.0 -98.453466

区分Python中的数据透视表列

1 个答案: