屏幕在Python中搜索基于Javascript的网页

时间:2011-11-18 14:06:33

标签: python screen-scraping beautifulsoup web-scraping

我正在使用Python中的屏幕抓取工具。但是,当我查看网页的来源时,我注意到大部分数据都来自Javascript。

任何想法,如何刮取基于javascript的网页? Python中的任何工具?

由于

3 个答案:

答案 0 :(得分:5)

使用selenium可以抓取基于javascript的网页。请特别注意Selenium WebDriver

答案 1 :(得分:4)

我使用的是webkit,它是Chrome和Safari背后的浏览器渲染器。有Python bindings to webkit through Qt

这是一个完整的Python example to execute JavaScript and extract the final HTML

答案 2 :(得分:3)

您可以使用QtWebKit

PyQt4模块