我正在使用Python中的屏幕抓取工具。但是,当我查看网页的来源时,我注意到大部分数据都来自Javascript。
任何想法,如何刮取基于javascript的网页? Python中的任何工具?
由于
答案 0 :(得分:5)
使用selenium可以抓取基于javascript的网页。请特别注意Selenium WebDriver。
答案 1 :(得分:4)
我使用的是webkit,它是Chrome和Safari背后的浏览器渲染器。有Python bindings to webkit through Qt。
这是一个完整的Python example to execute JavaScript and extract the final HTML。
答案 2 :(得分:3)