计算pandas数据帧中行之间的差异

时间:2015-06-21 02:34:35

标签: python pandas

我想计算数据框中两个类别之间的差异。例如,在以下情况中,我想计算每个工作中男性和女性之间的差异。但是,只有男性或女性才能完成一些工作。什么是有效的方法呢?感谢。

$(".chosen-select").chosen({
  disable_search_threshold: 10,
  width: "100%"
});

$('.fdatepicker').fdatepicker({
    language: 'de',
    format: 'dd.mm.yyyy',
    weekStart:1
});

1 个答案:

答案 0 :(得分:2)

你可以做一个支点,使同一份工作的男性和女性工资在同一行。然后,您可以直观地比较或运行其他基于行的代码。

import pandas as pd

df = pd.DataFrame({'job': ['a', 'a', 'b', 'b', 'c'], 'gender':['M', 'F', 'M', 'F', 'M'], 'income':[300, 200, 450, 400, 350]})

compare_income_by_gender_df = df.pivot(index='job', columns='gender', values='income')

print compare_income_by_gender_df

导致

python pivot.py
gender    F    M
job             
a       200  300
b       400  450
c       NaN  350

另见:Pandas Reshaping and Pivot Tables