我有一大堆连续数据,我想用替换,随机序列项目进行抽样(例如,每次50天)。
如果我执行类似df.sample(50,replace=True)
的操作,它只会从帽子中抽出50个随机行。
我编写的代码可以解决问题,但这并不好。在熊猫中有没有一种标准的方法呢?
答案 0 :(得分:1)
假设使用Python2.7,在日期上对数据帧进行索引,排序,然后就可以非常好地选择行:
ga:LandingPagePath=~/tag/[0-9]{4,8}
显然确保my_df.iloc(xrange(10, 60))
的第二个参数。随机选择范围很容易。
答案 1 :(得分:0)
这样的事情会起作用吗?
df.loc[np.random.choice(df.where((df.date >= 1/1/16) & (df.date <= 3/15/16)) , 50, replace=True)]