re.findall在html中找不到字符串。这是我的代码:
def get_id(html_source):
the_button = re.findall("preview.aspx?id=1692003076", html_source)
print(the_button)
当我print(html_source)
时,我得到了html,该HTML包含“ preview.aspx?id = 1692003076”。 re.search也找不到该字符串。
我的代码中还有另一个re.findall,它工作正常:
id_matches = re.findall('<input type="checkbox" id="\d+"', html_source)
知道为什么它不起作用吗?
答案 0 :(得分:1)
请注意,“?”是正则表达式中的特殊字符。您需要对其进行转义。
答案 1 :(得分:0)
尝试在正则表达式中转义特殊字符:.
,?
。或者,使用html_source.find("preview.aspx?id=1692003076")
查找该特定字符串的第一个实例。
如果这不起作用,请在您的问题中发布HTML示例,以便我们重现此问题。