如何删除文本内容中的固定XML标记?

时间:2013-04-04 16:04:38

标签: xml regex word

我有包含内容的xml文件:

Hello
<Images>
<URL>google</URL>
</Images>
<Reviews>
Good
</Reviews>
everybody,

<Images>
<URL>bing</URL>
</Images>
<Reviews>
Good
</Reviews>
I am Nguyen

输出:

Hello everybody, I am Nguyen

如何删除<Images></Reviews>之间的内容。

以上示例数据很小。实际上,我有一个大数据。

1 个答案:

答案 0 :(得分:1)

您可以用一个空格替换(?:\s*<(Images|Reviews)>.+?</\1>\s*)+。如果您正在使用的正则表达式风格不支持dot-all(代表所有字符的点,包括换行符),则必须使其更加复杂:{{1在JavaScript中运行。