我试图仅在我的数据框中包含特定时间间隔内的数据。以下代码段应该澄清我的问题,
index = df2.index.unique()
for i in range(len(index) - 1):
valid_time_frame = (df.index > index[i].date() +
_datetimeOffset(starting_hours)) & \
(df.index <= index[i + 1].date() +
_datetimeOffset(ending_hours))
df.loc[timer, ['index']] = index[i + 1]
def _datetimeOffset(hours):
return pd.offsets.DateOffset(hours=hours, minutes=00)
df和df2是两个pandas数据帧。当数据帧变得非常大时,这个for循环需要太长时间。我试图对它进行矢量化,但我无法管理。有没有人遇到过这个问题?
祝你好运! : - )