从XML中提取文本

时间:2016-03-14 13:44:26

标签: xml notepad++ cdata

我正在寻找一种方法来提取<!CDATA[]>中的XML文件中的所有文本部分。有自己的程序或快速方法吗?我使用notepad ++来编辑XML文件。也许有一个插件,我还没有意识到我可以使用?

2 个答案:

答案 0 :(得分:0)

你可以在python中使用xml.dom库中的minidom; 这里是你可以找到一些例子的链接:

https://docs.python.org/2/library/xml.dom.minidom.html

答案 1 :(得分:0)

您可以使用Notepad ++的查找功能,使用以下正则表达式: (?<=<!\[CDATA\[).*?(?=\]\]>)

有关如何在Notepad ++中使用正则表达式的详细信息,请参阅http://docs.notepad-plus-plus.org/index.php/Regular_Expressions