我有一个大型数据框。其中一列是时间(只是表示秒数的整数)。我想做一个groupBy,其中每个组代表说2秒的数据。这样做可以让我使用一行代码在所有组上使用std或mean函数。目标是能够丢弃不符合特定标准的数据的时间增量。以下伪代码有希望代表我想要做的事情。请原谅粗暴,因为我对熊猫很新。
grouped = df.groupBy(df['time']) #grouped for say 2 second increments.
groupStd = grouped.std()
df.drop( items in group where groupStd> val)
convert back to dataframe after the rows have been removed.
如果有人可以帮我填写非常有帮助的空白。谢谢!