a = df[df.contribution <= 0.1].sample(frac = 0.1)
我需要执行以下操作: 提取任何行样本,但行的总贡献应小于100
a = df.sample(sum(df['contribution'])<100)
答案 0 :(得分:0)
以为您希望样本包含的记录多于少。 可悲的是使用循环。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(1,35,(15,1)),columns = ['contribution'])
for i in reversed(range(len(df))):
if df['contribution'].sample(i).sum() < 100:
print df
break