beautifulsoup找到有和没有正则表达式的文本

时间:2011-02-25 06:04:55

标签: beautifulsoup

html:

<td>some key
</td>

找不到正则表达式:

soup.find(text='some key')

返回无

使用正则表达式查找

soup.find(text=re.compile('some key'))

返回了td节点。

有人会指出两种方法之间的区别吗? “some key”是没有特殊字符的文字字符串。我注意到在“某个键”末尾有一个回车符</td>出现在下一行。

谢谢。

1 个答案:

答案 0 :(得分:12)

Beautifulsoup使用==来匹配标签和搜索字符串之间的内容。自'some key\r\n'!= 'some key'以来,搜索失败。