根据该行中的值以及前面的一些行来抓取熊猫数据框的一行

时间:2018-06-20 18:59:37

标签: python pandas dataframe

我有许多具有以下结构的数据框。

    TRCODEP     10101     10201     20101     20201 20203
    43826     4:00:00       NaN       NaN       NaN   NaN
    43827         NaN       NaN       NaN       NaN   NaN
    43828         NaN  20:00:00       NaN       NaN   NaN
    43829         NaN       NaN       NaN  20:35:00   NaN
    43830    20:45:00       NaN       NaN       NaN   NaN
    43829         NaN       NaN  02:00:00       NaN   NaN

对于每个数据框,我想创建一个新的数据框,以选择10101列中具有非NaN条目的行以及前三行。我遇到了麻烦,因为如上所述,我可能有多个10101的非NaN条目。而且,即使假设解决了这个问题,我似乎也无法使用df['10101'].notna().index[0]df['10101'].notna().index[0]-3对数据帧进行切片。

我有什么选择?

1 个答案:

答案 0 :(得分:1)

并不难。您可以使用Series.last_valid_index和一些切片来做到这一点:

# get index of last valid non-null value in 10101
idx = df.index.get_loc(df['10101'].last_valid_index())
# slice rows (with some minor bounds checking)
df.iloc[max(0, idx - 3):idx + 1]

   TRCODEP     10101     10201 20101     20201  20203
1    43827       NaN       NaN   NaN       NaN    NaN
2    43828       NaN  20:00:00   NaN       NaN    NaN
3    43829       NaN       NaN   NaN  20:35:00    NaN
4    43830  20:45:00       NaN   NaN       NaN    NaN