转换为XML

时间:2010-05-04 19:30:11

标签: xml regex

我正在尝试将从维基百科下载的对话转换为XML。我使用特殊导出来获取XML格式的页面...这非常有用,直到我进入主对话。

<conversation>
    {{PersonA|Cheese}}
    {{PersonB|I like it too...}}
    {{PersonA|Cheese?}}
</conversation>

这不是真正的对话......无论如何,我想知道将这样的大规模会话转换为有效XML的最简单方法是什么?

<conversation>
    <personA>Cheese</personA>
    <personB>I like it too...</personB>
    <personA>Cheese?</personA>
</conversation>

谢谢,这太长了,无法手动完成。我猜是正则表达式可以帮助...不知何故。

1 个答案:

答案 0 :(得分:2)

模式:

\{\{(.*?)\|(.*?)\}\}

替换:

<$1>$2</$1>

这是一个适合您样本的简单解决方案,但根据确切的格式,可能需要更复杂的表达式。例如,如果名称包含管道怎么办?如果文本包含两个结束的大括号怎么办?文字可以跨越多行吗?