我在创建正则表达式时遇到问题。
具体来说,是一个正则表达式,用于查找所有简单的HTML标记(例如<B>
<strong>
<u>
等)及其内容(后续标记与html标记匹配的内容)。< / p>
到目前为止,我创建了一个正则表达式(regex101.com/r/lA0kI1/1):
(?<html_tag>(?<open>\<(?<tag>\w+)\>))(?<content>(\g<html_tag>)|.*)(?<close>\<\/\k<tag>\>)
我想得到这个结果(关于这个模式的东西):
MATCH 1
html_tag [0-3] `<b>`
open [0-3] `<b>`
tag [1-2] `b`
content [3-47] `strong<i>italic</i>and again strong`
close [47-51] `</b>`
MATCH 2
html_tag [14-28] `<i>`
open [14-18] `<i>`
tag [15-16] `i`
content [17-24] `italic`
close [24-28] `</i>`
如何获得上述结果?