我正在解析一个XML文件,该文件在某些标签之间包含我不想解析的文本,甚至可能包含损坏的标签。如何使用可用于Perl的xml解析的模块选择不解析该文本?
提前致谢。
答案 0 :(得分:4)
如果XML被破坏(即格式不正确),您将无法使用XML解析器。这是一个功能。所以你需要先修复它。
如果XML格式正确,您可以使用ignore_elts
选项XML::Twig。您将看到XML,好像忽略的元素永远不存在。
或者,如果XML“不太破碎”,您可以尝试XML::Liberal,这可能能够处理它。或者不......
如果您拥有的是XHTML,HTML或其他东西,您可以使用XML :: LibXML或XML :: Twig以及相应的解析方法。
祝你好运......