我需要一个字符串来选择所有html标签文本编号的所有内容,除了在此行rel="bookmark">RANDOM WORDS</a></h1>
我尝试了字符串[<0-9a-zA-z/=|"-:.*?>]
,它选择了字面上的一切,它发现没关系,但我需要一个排除RANDOM WORDS,在上面提到的行中找到的选择。
答案 0 :(得分:1)
正则表达式不适合这项工作。请考虑使用XML / HTML DOM解析器并以这种方式提取所需的信息!
您在制作RegEx以完成此任务时遇到问题的原因是HTML标记语言不是常规 - 因此,不适合使用正则表达式进行处理!