我想随机采样我的数据框,但是在采样中,特定列至少应有1个唯一值:
数据集具有一列:“月”,它是1到12之间的数字值;我希望我的随机样本中每个月至少有一行。
这就是我用来采样的东西
df = df.sample(frac=0.2, replace=True, random_state=1)
更新:
应用Quang Hoang答案似乎可行:
最初的df.count()
给了我 864806 行,应用该功能后,它转到了 172956 ,如果我这样做了,df['month'].unique()
我得到了:
array([ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])
是否有熊猫内置方法来做同样的事情?
答案 0 :(得分:0)
也许:
.my-class:hover body {
background: #MyHexColor;
}