如何从这个迟到的div中提取信息?

时间:2013-07-24 14:55:00

标签: selenium screen-scraping web-crawler phantomjs

我有一个基于Python的Selenium网络爬虫,带有PhantomJS驱动程序,我正试图从这样的页面收集信息:

http://www.zillow.com/homedetails/3534-Stettinius-Ave-Cincinnati-OH-45208/34211495_zpid/

我想要使用此XPath的元素://*[@id="transactionsTable"]

我在页面上有延迟,但它没有加载信息。为什么不呢?

1 个答案:

答案 0 :(得分:0)

我认为这个问题与滚动相关,但我尚未对它进行QA测试。驱动程序必须向下滚动到该点,然后页面才会加载。

This seems relevant