我有一个我想定期下载的网址。它只能从需要javascript支持的登录帐户访问,所以我被迫使用Selenium和PhantomJS,相信我。否则,我只会使用urllib,但它会给我一个错误信号。
这是一个CSV文件,最多1000行,大约6列。
我想最终将此CSV列入列表。有谁知道如何使用Selenium Webdriver下载CSV?
非常感谢。
编辑:我只是想从Selenium的网址下载CSV。没别了。
答案 0 :(得分:1)
其实非常简单。使用我在堆栈中给出的另一个答案
https://stackoverflow.com/a/21871600/2423379
编辑:在无头模式下运行Firefox
要求:
sudo apt-get install xvfb
(或发行版中的等效命令)pip install --user xvfbwrapper
代码部分
from xvfbwrapper import Xvfb
vdisplay = Xvfb()
vdisplay.start()
# launch stuff inside virtual display here
vdisplay.stop()
答案 1 :(得分:1)
page_source
属性怎么样?
browser.get("http://winterolympicsmedals.com/medals.csv")
csv_file = browser.page_source
print(csv_file)
试试这个,我的朋友。我使用Selenium + Python + HTMLUnit,工作得很轻松。
希望它适用于你的PhantomJS