我正在使用pandas(Python)从excel表中提取一些数据。 目前我编写了一个代码,遍历每一列,如果找到文本,则返回整列:
<div class="table">4:3
<div class="top">
<div class="item">4:3</div>
</div>
</div>
但是我无法弄清楚以下问题: 我只想要返回单词“getText”之后的行内容。
有人可以协助吗?
谢谢
答案 0 :(得分:0)
您可以使用contains
:
print df
a b
0 a b
1 f v
print df['a'].str.contains('a')
0 True
1 False
Name: a, dtype: bool
print df[df['a'].str.contains('a')]
a b
0 a b
print df.b[df['a'].str.contains('a')]
0 b
Name: b, dtype: object
编辑:
IIUC您可以将contains
与shift
和fillna
一起使用:
print df
a b
0 a b
1 f v
2 i k
print df['a'].str.contains('a')
0 True
1 False
2 False
Name: a, dtype: bool
print df['a'].str.contains('a').shift().fillna(False)
0 False
1 True
2 False
Name: a, dtype: bool
print df[df['a'].str.contains('a').shift().fillna(False)]
a b
1 f v