复制数据集中的样本?

时间:2016-12-06 03:13:19

标签: python machine-learning data-mining sampling

我使用代码检查我的数据集'df',并在'Has_Arrears'列中看到严重不平衡。我会在Has_Arrears = 1下使用重复样本扩展我的目标数据集35次。即每次观察Has_Arrears = 3次采样35次。我怎样才能实现这一目标?干杯

如果我想使用分层抽样,我该如何编码?

enter image description here

1 个答案:

答案 0 :(得分:0)

如果我理解正确,这可能就是你要找的东西:

new = df['Has_Arrears'] == 1
a = df[new]
df = df.append([a]*35, ignore_index=True)