尝试使用Beautiful Soup在html代码中查找某些标签4.有一个这样的标签:
<a href='obec.php?kod_obce=511226'>Ábelová</a>
在html中。
问题是,当我尝试使用re.compile
时,bs4无法找到这些标记。
以下是代码的一部分:
obce = soup.findAll("a", attrs={'href':re.compile("obec.php?kod_obce.*")})
一无所获。
你知道什么是错的吗?
答案 0 :(得分:4)
?
是正则表达式的特殊字符:它表示p
或没有字符。带有问号的字符串被拒绝。使用转义:
r"obec.php\?kod_obce.*"