Question

我正在尝试针对给定的数据集找到在怀孕期间吸烟的女性中每天吸烟的平均数量。目前，我正在尝试

mean = data.groupby(['male', 'cigs']).mean()
print(mean)

这给了我每天抽烟每支烟的平均家庭平均收入（即每天0，每天2，每天8等）。我如何获得的，所以这是吸烟> = 1的人的平均家庭收入？

另外，这是我的第一篇文章，如果没有足够的细节，请原谅我。

Answer 1

我假设“ 雪茄”是指每天吸烟的数量。您可以首先根据Cigs> = 1过滤数据，然后应用您的操作。

data_on_people_who_smoke = data[data.cigs >= 1]
mean = data_on_people_who_smoke.groupby(['male', 'cigs']).mean()
print(mean)

Answer 2

mean = data[data['cigs']>1]['income'].mean()
print (mean)

这将为您提供所有吸烟至少1烟的受访者的平均收入。不要按性别或香烟分组。首先过滤，然后取平均值。