多索引系列中的自定义聚合

时间:2019-03-21 19:11:59

标签: python pandas

如何替换

中的列
import numpy as np
import pandas as pd
arrays = [np.array(['bar', 'bar', 'bar','baz', 'baz','baz', 'foo', 'foo','foo']),
          np.array(['one', 'two', 'three', 'one', 'two','three', 'one', 'two','three'])]
s = pd.Series(np.random.randn(9), index=arrays)
print(s)

bar  one      0.791608
     two     -0.966179
     three    0.320251
baz  one      0.043479
     two     -1.637586
     three   -1.133128
foo  one     -0.575991
     two     -1.080433
     three    0.946663

按包含自定义聚合结果(例如

)的列
  

(3rd_entry-1st_entry)/ 1st_entry

每个第一级索引组是什么?

即,“ bar”的列值将是

的结果
(0.320251-0.791608)/0.791608

,结果系列应打印为

bar  -0.5954424412
baz  ...
foo  ...

1 个答案:

答案 0 :(得分:1)

first之后使用lastgroupby,也可以通过nth进行检查

g=s.groupby(level=0)
(g.last()-g.first())/g.first()
Out[132]: 
bar   -0.818922
baz   -0.150440
foo    0.266949
dtype: float64

或者只是切片

(s.loc[:,'three']-
   s.loc[:,'one'])/s.loc[:,'one']
Out[135]: 
bar   -0.818922
baz   -0.150440
foo    0.266949
dtype: float64