正则表达式查找HTML表单的内容

时间:2014-06-03 14:34:15

标签: python regex

我很难找到HTML表单的内容(或任何其他标签)。我试过了

    forms = re.findall('<form.*/form>', htmltext)

但没有结果。哪里出错?

1 个答案:

答案 0 :(得分:0)

除非表单在一行上,否则无法正常工作,您需要re.DOTALL作为选项

forms = re.findall('<form.*/form>', htmltext, re.DOTALL)

您可以使用re.IGNORECASE | re.DOTALL,以防您需要捕获<Form ...

之类的内容