从Selenium的url下载CSV?

时间:2014-02-18 20:24:43

标签: python selenium selenium-webdriver phantomjs ghostdriver

我有一个我想定期下载的网址。它只能从需要javascript支持的登录帐户访问,所以我被迫使用Selenium和PhantomJS,相信我。否则,我只会使用urllib,但它会给我一个错误信号。

这是一个CSV文件,最多1000行,大约6列。

我想最终将此CSV列入列表。有谁知道如何使用Selenium Webdriver下载CSV?

非常感谢。

编辑:我只是想从Selenium的网址下载CSV。没别了。

2 个答案:

答案 0 :(得分:1)

其实非常简单。使用我在堆栈中给出的另一个答案

https://stackoverflow.com/a/21871600/2423379

编辑:在无头模式下运行Firefox

要求:

  • sudo apt-get install xvfb(或发行版中的等效命令)
  • pip install --user xvfbwrapper

代码部分

from xvfbwrapper import Xvfb

vdisplay = Xvfb()
vdisplay.start()

# launch stuff inside virtual display here

vdisplay.stop()

参考:Firefox-selenium in headless mode

答案 1 :(得分:1)

page_source属性怎么样?

browser.get("http://winterolympicsmedals.com/medals.csv")
csv_file = browser.page_source
print(csv_file)

试试这个,我的朋友。我使用Selenium + Python + HTMLUnit,工作得很轻松。

希望它适用于你的PhantomJS