如何从总体的两个变量中抽取样本

时间:2018-12-10 18:55:43

标签: python dataframe

我有一个数据集,女学生比男学生多。我需要分析哪种性别在他们的测试中表现更好。因为它们的数目不相等,所以我需要画出相等的样本。

female=df.sample (df.query ("gender=='female'")=200)
male=df.sample (df.query ("gender=='male'")=200)

这是正确的代码吗?

1 个答案:

答案 0 :(得分:0)

不完全是。除其他外,您有语法错误。假设您要从每个总体中获取200个样本,请尝试以下操作:

female = df[df['gender']=='female'].sample(200)
male   = df[df['gender']==  'male'].sample(200)