我们可以根据汇总标准对熊猫数据框进行采样吗

时间:2018-07-06 21:52:16

标签: pandas random

a = df[df.contribution <= 0.1].sample(frac = 0.1)

我需要执行以下操作: 提取任何行样本,但行的总贡献应小于100

a = df.sample(sum(df['contribution'])<100)

1 个答案:

答案 0 :(得分:0)

以为您希望样本包含的记录多于少。 可悲的是使用循环。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(1,35,(15,1)),columns = ['contribution'])

for i in reversed(range(len(df))):
    if df['contribution'].sample(i).sum() < 100:
        print df
        break