Python:re.findall在html中找不到字符串

时间:2018-12-28 20:53:17

标签: python

re.findall在html中找不到字符串。这是我的代码:

def get_id(html_source):
    the_button = re.findall("preview.aspx?id=1692003076", html_source)
    print(the_button)

当我print(html_source)时,我得到了html,该HTML包含“ preview.aspx?id = 1692003076”。 re.search也找不到该字符串。

我的代码中还有另一个re.findall,它工作正常:

id_matches = re.findall('<input type="checkbox" id="\d+"', html_source)

知道为什么它不起作用吗?

2 个答案:

答案 0 :(得分:1)

请注意,“?”是正则表达式中的特殊字符。您需要对其进行转义。

答案 1 :(得分:0)

尝试在正则表达式中转义特殊字符:.?。或者,使用html_source.find("preview.aspx?id=1692003076")查找该特定字符串的第一个实例。

如果这不起作用,请在您的问题中发布HTML示例,以便我们重现此问题。