Pandas中的采样序列

时间:2017-02-01 17:50:00

标签: python pandas

我有一大堆连续数据,我想用替换,随机序列项目进行抽样(例如,每次50天)。

如果我执行类似df.sample(50,replace=True)的操作,它只会从帽子中抽出50个随机行。

我编写的代码可以解决问题,但这并不好。在熊猫中有没有一种标准的方法呢?

2 个答案:

答案 0 :(得分:1)

假设使用Python2.7,在日期上对数据帧进行索引,排序,然后就可以非常好地选择行:

ga:LandingPagePath=~/tag/[0-9]{4,8}

显然确保my_df.iloc(xrange(10, 60)) 的第二个参数。随机选择范围很容易。

答案 1 :(得分:0)

这样的事情会起作用吗?

df.loc[np.random.choice(df.where((df.date >= 1/1/16) & (df.date <= 3/15/16)) , 50, replace=True)]