我是编程新手,正在尝试从似乎是由页面执行的javascript加载的网页上抓取数据。
有人告诉我硒是能够做到这一点的好选择
我将Jupyter与Anaconda一起使用
我已经使用conda install安装了硒
但是,当尝试使用网络驱动程序时,我遇到了问题
from selenium import webdriver
driver = webdriver.firefox()
显示的错误是:
WebDriverException: Message: 'geckodriver' executable needs to be in PATH.
对此我该怎么办?
谢谢
答案 0 :(得分:0)
您需要从here下载geckodriver(Firefox浏览器和需要正确集成,因此请为两者下载正确的版本)并执行以下操作:
# Generic way
driver = webdriver.Firefox(PATH_TO_YOUR_DOWNLOADED_GECKODRIVER)
# Windows example below
driver = webdriver.Firefox("C:\\Users\\YOUR_USERS_ACCOUNT_NAME_IN_WINDOWS\\ANY_DIRECTORY_YOU_WANT_UNDER_THIS_ACCOUNT\\geckodriver.exe")
# Linux example below
driver = webdriver.Firefox("usr\\local\\bin\\geckodriver")
此外,对于Firefox,您需要使用大写字母 F
,并将“ \”替换为上面示例中的双“ \\”。
提示:在具有适当权限的目录内下载geckodriver。然后解压缩该文件夹,找到exe文件及其路径。然后将此路径插入括号中。请使用双行而不是我上面告诉您的单行。