应用错误收集

从XML中提取文本

时间：2016-03-14 13:44:26

标签： xml notepad++ cdata

我正在寻找一种方法来提取<!CDATA[]>中的XML文件中的所有文本部分。有自己的程序或快速方法吗？我使用notepad ++来编辑XML文件。也许有一个插件，我还没有意识到我可以使用？

2 个答案:

答案 0 :(得分：0)

你可以在python中使用xml.dom库中的minidom; 这里是你可以找到一些例子的链接：

https://docs.python.org/2/library/xml.dom.minidom.html

答案 1 :(得分：0)

您可以使用Notepad ++的查找功能，使用以下正则表达式： (?<=<!\[CDATA\[).*?(?=\]\]>)

有关如何在Notepad ++中使用正则表达式的详细信息，请参阅http://docs.notepad-plus-plus.org/index.php/Regular_Expressions。