Python PANDAS:首次出现列值后删除所有行

时间:2015-12-08 18:35:35

标签: python pandas

我有一个PANDAS数据框,其中的列具有打开/关闭状态值和排名字段值。按排名字段排序后,在第一次出现" open"之后删除/删除所有行的最佳方法是什么?值?如果我应该使用PANDAS采用迭代器函数或基于标准索引的方法,我感到很困惑。任何建议都会很棒!

编辑:这就是我到目前为止所开始的

df["Rank", "Status"].sort_values(by="Rank")

我想要完成的输出如下所示:

由此:

Rank Status
1    Closed
5    Closed
6    Open
9    Closed
10   Open

对此:

Rank Status
 1    Closed
 5    Closed
 6    Open

2 个答案:

答案 0 :(得分:4)

您可以在排序时简单地重新索引数据框,然后找到第一个“打开”实例的索引位置并将数据切片到那里....

import pandas as pd
#create dataframe
df = pd.DataFrame({
'Rank' : [5, 1, 10 ,6, 9],   
'Status' : ['Closed', 'Closed', 'Open', 'Closed', 'Open']
})

# sort and reindex
df = df.sort('Rank').reset_index()

#slice to first occurrence of your value
df.loc[: df[(df['Status'] == 'Open')].index[0], :]

答案 1 :(得分:1)

几乎相同的答案。直接操作df。

df = df[:df[df['Status'] == 'Open'].index[0]]

这将返回值的第一个实例的索引,然后将DataFrame切片到该行。