XML :: LibXML :: Reader是否读取HTML?

时间:2010-04-23 08:14:00

标签: html perl xml-libxml

我在XML::LibXML::Reader文档中找不到任何关于解析HTML的内容。我试图解析一个HTML网站,但它没有用。 我的结论是,XML :: LibXML :: Reader不适用于HTML吗?

2 个答案:

答案 0 :(得分:3)

除非它真的是XHTML,否则没有。 XML比HTML更具限制性,XML解析器通常无法解析HTML。

HTML::TokeParser(或其基类HTML::PullParser)与XML::LibXML::Reader最相似(但并非完全相似)。

您可能希望查看HTML-Tree类似于与HTML一起使用的LibXML。还有HTML::TreeBuilder::LibXML,它围绕HTML-Tree包含了更多与LibXML兼容的界面。

答案 1 :(得分:1)

不,但是HTML::TreeBuilder::LibXML在HTML paser上实现了兼容的界面。