我很难找到HTML表单的内容(或任何其他标签)。我试过了
forms = re.findall('<form.*/form>', htmltext)
但没有结果。哪里出错?
答案 0 :(得分:0)
除非表单在一行上,否则无法正常工作,您需要re.DOTALL作为选项
forms = re.findall('<form.*/form>', htmltext, re.DOTALL)
您可以使用re.IGNORECASE | re.DOTALL,以防您需要捕获<Form ...