如何在AWS上的phantomjs中加载动态内容

时间:2017-04-27 08:02:03

标签: python selenium amazon-ec2 phantomjs

我试图解析此页面: https://www.oslobors.no/markedsaktivitet/#/list/shares/quotelist/ob/all/all/false 在AWS EC2 Linux机器上使用python 2.7,phantomjs,selenium和bs4。这一切都像我在家里运行Ubuntu和OSX的两台机器上的魅力一样。然而,AWS上的Phantomjs似乎无法运行任何脚本,并且不显示空白页面,而是显示没有任何动态内容的页面:

Screenshot from selenium

url = "https://www.oslobors.no/markedsaktivitet/#/list/shares/quotelist/ob/all/all/false"

browser = webdriver.PhantomJS(PHANTOMJS_PATH, service_args=['--ignore-ssl-errors=true', '--ssl-protocol=any'], service_log_path=os.path.devnull)
browser.set_window_size(1280, 1024)
browser.get(url)
time.sleep(10)

soup = BeautifulSoup(browser.page_source, "lxml")

我已经尝试过永远等待,WebDriverWait,不同ssl协议和google的组合,我可以找到任何有用但没有任何暗示的东西。有没有人知道为什么会这样?

0 个答案:

没有答案