我有一个带有几个ID的数据框,然后是这样的钱栏
Id1 Id2 Id3 Money
1 10 13 10000
2 15 12 12500
3 20 11 60000
我需要一个脚本来随机选择行,直到我赚到8000万美元。我假设有一个while循环,例如...
while sum(money) < 80000000:
df.sample()
答案 0 :(得分:1)
也许可以改写一下您的问题,似乎您正在寻找随机的行样本,使得Money
的总和<80000000。一种实现方法是使用{{1 }}进行改组,并结合.sample()
:
.cumsum()
这将采样而不替换。
与逐行处理相比,这可能不是最高效的内存,但应该可以解决合理大小的问题。