我试图学习python,但我遇到了问题。我需要随机选择数据框的X行,并且我使用sample.(frac=X)
进行操作,但在我的情况下,我可以有重复的行,sample()
不要这样做。
以下是我正在做的事情:
dfSub = dataFrame.groupby(self.column, as_index=False).apply(lambda x: x.sample(frac=self.percentage)).reset_index(drop=True)
如何随机选择重复行的几率?
答案 0 :(得分:1)
你想要的是被替换的随机抽样,即从骨灰盒中抽出球之后,你将它放回到骨灰盒中,这样就可以再次抽出。
您只需将replace
参数设置为True
:
lambda x: x.sample(frac=self.percentage, replace=True)