我有一个数据集,女学生比男学生多。我需要分析哪种性别在他们的测试中表现更好。因为它们的数目不相等,所以我需要画出相等的样本。
female=df.sample (df.query ("gender=='female'")=200)
male=df.sample (df.query ("gender=='male'")=200)
这是正确的代码吗?
答案 0 :(得分:0)
不完全是。除其他外,您有语法错误。假设您要从每个总体中获取200个样本,请尝试以下操作:
female = df[df['gender']=='female'].sample(200)
male = df[df['gender']== 'male'].sample(200)