我必须通过正则表达式从电子邮件中提取密码,因为密码位置的xpath是动态的。
以下是密码位置的xpath:
//*[@id=':k6']/div[1]/div/div[3]/div[3]/table/tbody/tr[3]/td
此位置的密码示例:
QFYFV3WL$8H!
此处id
是动态的,因此第一个挑战是为id
生成正则表达式。
其次,我们需要生成正则表达式以从密码字段中提取密码。
密码的每个字符都是动态的,可以包含任何字符
这里有任何帮助。
答案 0 :(得分:3)
您尝试做什么无法完成。在某些情况下,您可以使用正则表达式来解析html文档,但这种情况确实如此:您需要导航DOM。正则表达式引擎没有文档结构的概念。 HTML不是常规语言,因此无法使用正则表达式进行解析。
这是可以接受的情况是当你试图解析某些内容时,好像html文档只是一堆文本。如果您需要获取内部标记,您需要的是DOM解析器。
在SO:
上引用关于此主题的famous answer每次尝试使用正则表达式解析HTML时, 不圣洁的孩子哭泣处女的血,俄罗斯黑客哄骗你 web应用