我想匹配HTML标记内的数字,例如:
Sometext<sometag><htmltag>123123</htmltag></sometag>
我想创建一个正则表达式,找到我选择的HTML标记内的数字,例如123123
内的<htmltag>
。
答案 0 :(得分:3)
不,您不需要“匹配”,您需要提取HTML节点。使用HTML解析器。 HTML解析器使用起来更简单,对更改更加健壮,并且更容易扩展(例如,抓取同一文档的更多部分)。另一方面,正则表达式只是错误的工具,因为 HTML不是常规语言。
答案 1 :(得分:1)
如果这两个标签之间只有数字,绝对没有空格或任何东西,你只需使用这个正则表达式:
/<htmltag>([0-9]+)<\/htmltag>/
或者,如果可能有空格:
/<htmltag>\s*([0-9]+)\s*<\/htmltag>/