Python正则表达式一无所获

时间:2014-09-19 06:53:35

标签: python regex beautifulsoup

尝试使用Beautiful Soup在html代码中查找某些标签4.有一个这样的标签:

<a href='obec.php?kod_obce=511226'>Ábelová</a>

在html中。

问题是,当我尝试使用re.compile时,bs4无法找到这些标记。

以下是代码的一部分:

obce = soup.findAll("a", attrs={'href':re.compile("obec.php?kod_obce.*")})

一无所获。

你知道什么是错的吗?

1 个答案:

答案 0 :(得分:4)

?是正则表达式的特殊字符:它表示p或没有字符。带有问号的字符串被拒绝。使用转义:

r"obec.php\?kod_obce.*"