用pandas在python中进行分组数据分析

时间:2015-04-30 17:19:07

标签: python pandas

我有一个大型数据框。其中一列是时间(只是表示秒数的整数)。我想做一个groupBy,其中每个组代表说2秒的数据。这样做可以让我使用一行代码在所有组上使用std或mean函数。目标是能够丢弃不符合特定标准的数据的时间增量。以下伪代码有希望代表我想要做的事情。请原谅粗暴,因为我对熊猫很新。

 grouped = df.groupBy(df['time'])  #grouped for say 2 second increments. 
 groupStd = grouped.std()
 df.drop( items in group where groupStd> val)
 convert back to dataframe after the rows have been removed. 

如果有人可以帮我填写非常有帮助的空白。谢谢!

0 个答案:

没有答案