我正在编写一个python脚本来对公共网站进行屏幕抓取。这很好,直到我想与AJAX实现的树控件进行交互。显然,有大量的javascript控制着AJAX请求。树控件似乎是JBoss RichFaces RichTree组件。
我应该如何以编程方式与此组件进行交互?
答案 0 :(得分:1)
您需要从客户端向服务器进行AJAX调用并解释数据。与以任何方式抓取HTML相比,解释AJAX数据更容易,更不容易出错。
虽然没有记录,但如果找出AJAX API可能有点棘手。像wireshark这样的网络嗅探器工具在那里很有帮助,现在也可能有一些有用的插件供您的浏览器使用。多年来我一直不需要那样做。 : - )
答案 1 :(得分:1)