Question

我有一个数据框（salaries），其中一列（type）代表了教学中心内的老师人数。的教师类别为：AssocProf，AsstProf和Prof。

我必须从数据框中选择60个样本（行）的随机子集，以便此新数据框包含的教师班级数量与之相同。也就是说，总共有3个班级的老师。然后，子集必须包含20行AssocProf，20行AsstProf和20行Prof。我的代码如下：

grouping = salaries.groupby("type")
grouping.apply(lambda x: x.sample (n = 20, replace = True)).head()

我打算用这段代码对每种类型的老师进行20个采样。但是，它的效果并不理想，因为它仅选择5行，其中2行来自一个教师班级，另外2行来自另一个班级，最后一行来自第三班级。我在做什么错了？

谢谢。