我正在尝试将从维基百科下载的对话转换为XML。我使用特殊导出来获取XML格式的页面...这非常有用,直到我进入主对话。
<conversation>
{{PersonA|Cheese}}
{{PersonB|I like it too...}}
{{PersonA|Cheese?}}
</conversation>
这不是真正的对话......无论如何,我想知道将这样的大规模会话转换为有效XML的最简单方法是什么?
<conversation>
<personA>Cheese</personA>
<personB>I like it too...</personB>
<personA>Cheese?</personA>
</conversation>
谢谢,这太长了,无法手动完成。我猜是正则表达式可以帮助...不知何故。
答案 0 :(得分:2)
模式:
\{\{(.*?)\|(.*?)\}\}
替换:
<$1>$2</$1>
这是一个适合您样本的简单解决方案,但根据确切的格式,可能需要更复杂的表达式。例如,如果名称包含管道怎么办?如果文本包含两个结束的大括号怎么办?文字可以跨越多行吗?