根据可变数量的标准选择值

时间:2017-05-25 20:06:07

标签: python pandas

假设:

  • 数据集;

  • 来自该数据集的
  • 属性(例如性别,教育程度等)

我需要找到性别和教育水平的所有可能值: ex (男,单身汉)

我已经列出了这些元组。

现在我想回到数据集中,挑选出具有性别和教育水平以及其他一些属性的特定值的行。

df1 = df[df['gender'] = 'Male' & df['education level'] = 'Bachelors']

但是对于属性的所有可能值。

1 个答案:

答案 0 :(得分:0)

假设您的元组列表位于名为</body>

的变量中
tups

或者

df.set_index(['gender', 'education']).loc[tups].reset_index()

我们可以用

加快速度
t = pd.Series(list(zip(df.gender, df.education)), df.index)
df[t.isin(tups)]