正则表达式中的聚合使用替换

时间:2013-06-07 13:31:13

标签: regex

是否可以使用Regex替换进行聚合。

输入:

 Experience <tag>Nikon</tag>'s new <tag>Advanced</tag> <tag>Scene</tag>  
 <tag>Recognition</tag> <tag>System</tag> featuring a 91,000 pixel <tag>RGB</tag> light 
 meter capable of rendering unprecedented levels of accuracy to <tag>AF</tag>, 
 <tag>AE</tag>, i <tag>TTL</tag> flash <tag>control</tag>, <tag>face</tag> 
 <tag>recognition</tag> and auto <tag>white</tag> <tag>balance</tag>.

结果:

 Experience <tag>Nikon</tag>'s new <tag>Advanced Scene Recognition System</tag>    
 featuring a 91,000 pixel <tag>RGB</tag> light meter capable of rendering unprecedented    
 levels of accuracy to <tag>AF</tag>, <tag>AE</tag>, i <tag>TTL</tag> flash 
 <tag>control</tag>, <tag>face recognition</tag> and auto <tag>white balance</tag>.

正在尝试聚合继续&lt;标签&gt;由空格分隔的节点。

2 个答案:

答案 0 :(得分:3)

虽然您不应该使用正则表达式来解析XML / HTML,但看起来您想要替换

</tag>(\s*)<tag>

\1

对于您可能需要应用/ </tag>的任何转义(可能<\/tag>)。

答案 1 :(得分:1)

如果您只是想合并分别错误标记的代码,为什么不尝试:

/<\/tag>\s<tag>/\s/g