我有一个数据帧df
Name dist
aaaa 10
bbbb 11
cccc 41
dddd 77
我想删除dist小于10的行到下一行。被驱逐的输出是
Name dist
aaaa 10
cccc 41
dddd 77
为此,我使用了以下代码
>>> for idx,row in df.iterrows():
... if idx < df.shape[0]-1:
... if ((df.ix[idx+1,'dist_to_TSS']-df.ix[idx+1,'dist_to_TSS'])<10):
... df.drop(row)
...
但我得到错误。你能帮忙吗?
答案 0 :(得分:1)
如果您决定要删除哪些行的标准有点棘手,例如与上一行/下一行中的值相关的一个简单方法是简单地构建一个要删除的行的索引列表,然后在最后一次删除它们。 e.g。
indexes_to_drop = []
for i in df.index:
....
if {make your decision here}:
indexes_to_drop.append(i)
....
df.drop(df.index[indexes_to_drop], inplace=True )
答案 1 :(得分:0)
IIUC你可以这样做:
In [110]: df = df[df.dist.diff().fillna(100) >= 10]
In [111]: df
Out[111]:
Name dist
0 aaaa 10
2 cccc 41
3 dddd 77
说明:
In [100]: df.dist.diff()
Out[100]:
0 NaN
1 1.0
2 30.0
3 36.0
Name: dist, dtype: float64
In [101]: df.dist.diff().fillna(100)
Out[101]:
0 100.0
1 1.0
2 30.0
3 36.0
Name: dist, dtype: float64
In [102]: df.dist.diff().fillna(100) >= 10
Out[102]:
0 True
1 False
2 True
3 True
Name: dist, dtype: bool