是否有可能使用pyexecjs与scrapy?

时间:2014-10-12 10:00:58

标签: javascript python web-scraping scrapy screen-scraping

我刚才偶然发现了pyexecjs,我想知道它是否可以与scrapy一起使用来抓取JS生成的数据。 https://github.com/doloopwhile/PyExecJS

我检查了如何使用库的示例,但我不确定如何将其与scrapy集成。

1 个答案:

答案 0 :(得分:0)

我强烈建议您使用PhantomJS尝试Selenium。这是一个示例代码。

from selenium import webdriver

url = "http://www.taobao.com/"
browser = webdriver.PhantomJS()
browser.get(url)
input = browser.find_element_by_xpath("//input[@id='q']")
bnt = browser.find_element_by_xpath("//button[@class='btn-search']")
input.send_keys("watch")
bnt.submit()

有关API的更多信息,请参阅WebDriver API 至于如何将硒与scrapy整合,我的建议是将它嵌入到你蜘蛛的解析功能中。例如: