熊猫:在某个词之后得到行内容

时间:2016-02-12 08:47:57

标签: python excel pandas

我正在使用pandas(Python)从excel表中提取一些数据。 目前我编写了一个代码,遍历每一列,如果找到文本,则返回整列:

<div class="table">4:3
  <div class="top">
    <div class="item">4:3</div>
  </div>
</div>

但是我无法弄清楚以下问题: 我只想要返回单词“getText”之后的行内容。

有人可以协助吗?

谢谢

1 个答案:

答案 0 :(得分:0)

您可以使用contains

print df
   a  b
0  a  b
1  f  v

print df['a'].str.contains('a')
0     True
1    False
Name: a, dtype: bool

print df[df['a'].str.contains('a')]
   a  b
0  a  b

print df.b[df['a'].str.contains('a')]
0    b
Name: b, dtype: object

编辑:

IIUC您可以将containsshiftfillna一起使用:

 print df
   a  b
0  a  b
1  f  v
2  i  k

print df['a'].str.contains('a')
0     True
1    False
2    False
Name: a, dtype: bool

print df['a'].str.contains('a').shift().fillna(False)
0    False
1     True
2    False
Name: a, dtype: bool

print df[df['a'].str.contains('a').shift().fillna(False)]
   a  b
1  f  v