我需要有关正则表达式字符串的帮助

时间:2013-02-20 16:25:04

标签: regex string command

我需要一个字符串来选择所有html标签文本编号的所有内容,除了在此行rel="bookmark">RANDOM WORDS</a></h1>

中锚点结束标记内发现的单词的随机出现

我尝试了字符串[<0-9a-zA-z/=|"-:.*?>],它选择了字面上的一切,它发现没关系,但我需要一个排除RANDOM WORDS,在上面提到的行中找到的选择。

1 个答案:

答案 0 :(得分:1)

正则表达式不适合这项工作。请考虑使用XML / HTML DOM解析器并以这种方式提取所需的信息!

您在制作RegEx以完成此任务时遇到问题的原因是HTML标记语言不是常规 - 因此,不适合使用正则表达式进行处理!