在Perl中解析xml时如何忽略某些标记?

时间:2013-07-31 08:54:08

标签: xml perl tags

我正在解析一个XML文件,该文件在某些​​标签之间包含我不想解析的文本,甚至可能包含损坏的标签。如何使用可用于Perl的xml解析的模块选择不解析该文本?

提前致谢。

1 个答案:

答案 0 :(得分:4)

如果XML被破坏(即格式不正确),您将无法使用XML解析器。这是一个功能。所以你需要先修复它。

如果XML格式正确,您可以使用ignore_elts选项XML::Twig。您将看到XML,好像忽略的元素永远不存在。

或者,如果XML“不太破碎”,您可以尝试XML::Liberal,这可能能够处理它。或者不......

如果您拥有的是XHTML,HTML或其他东西,您可以使用XML :: LibXML或XML :: Twig以及相应的解析方法。

祝你好运......