我正在使用python webkit.WebView和gtk来抓取网页。但是,网页是由javascript动态加载的。
WebView“load-finished”事件不足以处理此问题。是否有任何指示/事件让我知道该页面甚至是完全加载的甚至是javascript产生的内容?
谢谢,
答案 0 :(得分:4)
没有真正的方法来确定该页面是否已完全加载。
一种方法是确定自上次请求以来的时间量。但是,有些页面会不断地重复提出请求。这在跟踪脚本和一些广告脚本时很常见。
我会做的是在网络视图说完它加载后使用一段时间... 5秒左右。它并不完美,但是你得到的最好,因为没有办法确定任意页面的“满载”是什么。