既然我可以通过WWW::Mechanize浏览网页并通过HTML::TreeBuilder::XPath访问ID来获取信息,我就会使用Firebug来读取DOM以便发现布局HTML树的。 Mechanize捕获的内容是非结构化HTML,对人眼不利。
使用Firebug确定我在典型方法后的身份?一旦我得到了id,那么我很高兴,只是我有几个id和页面有更多的ID要追逐,我希望得到(转储,打印等)DOM的格式化布局为了使这个发现更容易。虽然被授予,Firebug也很容易。我只是想知道我是否错过了一种更简单的方法。
答案 0 :(得分:3)
如果你需要文字,xmllint --html --format
(libxml2附带)做得不错。
如果你想要一棵树并弄乱它并在GUI中测试各种表达,那么Xacobeo就是你最好的朋友。
注意:由于这两个工具都依赖于libxml,因此请将HTML::TreeBuilder::XPath替换为HTML::TreeBuilder::LibXML以获得兼容性。评估XPath也会更快。
如果您了解Javascript / JQuery,那么还要安装FireQuery。然后,您可以在FireBug中测试CSS表达式,并将它们与通过CSS表达式选择HTML的模块一起使用,例如: Web::Query
答案 1 :(得分:0)
我使用Oxygen IDE中的XML Developer来进行最近在XPath上的开发: http://www.oxygenxml.com/download.html 它是一种30天试用版工具,但您也可以搜索XPath可视化工具
据我所知,它并没有为你想象一棵树(可能有一个小组在做这件事)。但它为您提供了一些功能完善的智能功能,可帮助您随时了解可用的节点。这对XPath来说非常重要,因为很难知道解析器枢轴真正指向的位置。