我在XML::LibXML::Reader文档中找不到任何关于解析HTML的内容。我试图解析一个HTML网站,但它没有用。 我的结论是,XML :: LibXML :: Reader不适用于HTML吗?
答案 0 :(得分:3)
除非它真的是XHTML,否则没有。 XML比HTML更具限制性,XML解析器通常无法解析HTML。
HTML::TokeParser(或其基类HTML::PullParser)与XML::LibXML::Reader最相似(但并非完全相似)。
您可能希望查看HTML-Tree类似于与HTML一起使用的LibXML。还有HTML::TreeBuilder::LibXML,它围绕HTML-Tree包含了更多与LibXML兼容的界面。
答案 1 :(得分:1)
不,但是HTML::TreeBuilder::LibXML在HTML paser上实现了兼容的界面。