我想计算数据框中两个类别之间的差异。例如,在以下情况中,我想计算每个工作中男性和女性之间的差异。但是,只有男性或女性才能完成一些工作。什么是有效的方法呢?感谢。
$(".chosen-select").chosen({
disable_search_threshold: 10,
width: "100%"
});
$('.fdatepicker').fdatepicker({
language: 'de',
format: 'dd.mm.yyyy',
weekStart:1
});
答案 0 :(得分:2)
你可以做一个支点,使同一份工作的男性和女性工资在同一行。然后,您可以直观地比较或运行其他基于行的代码。
import pandas as pd
df = pd.DataFrame({'job': ['a', 'a', 'b', 'b', 'c'], 'gender':['M', 'F', 'M', 'F', 'M'], 'income':[300, 200, 450, 400, 350]})
compare_income_by_gender_df = df.pivot(index='job', columns='gender', values='income')
print compare_income_by_gender_df
导致
python pivot.py
gender F M
job
a 200 300
b 400 450
c NaN 350