随机DataFrame样本具有至少1个列的唯一值

时间:2019-07-04 20:48:11

标签: python python-3.x pandas

我想随机采样我的数据框,但是在采样中,特定列至少应有1个唯一值:

数据集具有一列:“月”,它是1到12之间的数字值;我希望我的随机样本中每个月至少有一行。

这就是我用来采样的东西

df = df.sample(frac=0.2, replace=True, random_state=1)

更新:

应用Quang Hoang答案似乎可行: 最初的df.count()给了我 864806 行,应用该功能后,它转到了 172956 ,如果我这样做了,df['month'].unique()我得到了:

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12])

是否有熊猫内置方法来做同样的事情?

1 个答案:

答案 0 :(得分:0)

也许:

.my-class:hover body {
background: #MyHexColor;
}