我有一个数据框(salaries
),其中一列(type
)代表了教学中心内的老师人数。的教师类别为:AssocProf
,AsstProf
和Prof
。
我必须从数据框中选择60个样本(行)的随机子集,以便此新数据框包含的教师班级数量与之相同。也就是说,总共有3个班级的老师。然后,子集必须包含20行AssocProf
,20行AsstProf
和20行Prof
。我的代码如下:
grouping = salaries.groupby("type")
grouping.apply(lambda x: x.sample (n = 20, replace = True)).head()
我打算用这段代码对每种类型的老师进行20个采样。但是,它的效果并不理想,因为它仅选择5行,其中2行来自一个教师班级,另外2行来自另一个班级,最后一行来自第三班级。我在做什么错了?
谢谢。