Question

假设我有一个pandas DataFrame：

a   b   c  d  .... z
1   10  3  .
1   20  4  .
2   30  5  .
3   40  6  .
3   50  7  .  ....  .

我想制作一个DataFrame：

a    *not sure how to refer to this column?*
1   (10+20)/(3+4)  
2   30/5
3   (40+50)/(6+7)

我该怎么做？另外，如何引用创建的列？

我尝试了df.groupby（＆＃39; a＆＃39;）但后来我不知道如何在熊猫中写下我想要的东西。

Answer 1

试试这个：

In [216]: df.groupby('a').apply(lambda x: x['b'].sum()/x['c'].sum())
Out[216]:
a
1    4.285714
2    6.000000
3    6.923077
dtype: float64