使用selenium和phantomJS更改“user-agent”标头

时间:2015-09-21 20:27:20

标签: python selenium selenium-webdriver phantomjs

我正在尝试使用selenium登录表单,并收到一个奇怪的错误。我很肯定它与用户代理标题有关,但如果没有,我想知道如何去做。

以下是以表格形式登录的功能:

def log_in_phantom(username, password, url):
    dcap = dict(DesiredCapabilities.PHANTOMJS) 
    dcap["phantomjs.page.settings.userAgent"] = (<My user-agent>)
    browser = webdriver.PhantomJS(desired_capabilities = dcap)
    browser.get(url)
    browser.implicitly_wait(3)

    username = browser.find_element_by_id("username")
    if username.is_displayed():
        username.send_keys(username)

    password = browser.find_element_by_id("password")
    if password.is_displayed():
        password.send_keys(password)

    button = browser.find_element_by_class_name("btn-default")
    if button.is_displayed:
        button.click()

    session = browser.session_id
    print(browser.current_url)

这是我运行该功能时得到的结果:

selenium.common.exceptions.ElementNotVisibleException: Message: Error                   Message => 'Element is not currently visible and may not be manipulated'
 caused by Request => {<bunch of cookie data>}

在此Cookie数据中,我注意到

{"User-agent":"Python-urllib/3.5}

所以我尝试更改标题是不成功的。我使用所需的功能吗?我还缺少什么?我是网络抓取的新手,所以它真的可以是任何东西。

感谢您的时间

1 个答案:

答案 0 :(得分:0)

另一个隐藏字段id="username"会导致问题。

理想情况下,您应该使定位器更具体以匹配可见元素,例如:

driver.find_element_by_css_selector("div.login-form #username")

您也可以这样过滤掉可见元素:

username = next(element for element in driver.find_elements_by_id("username") 
                if element.is_displayed())
username.send_keys("test")

您可能还需要在搜索元素之前添加显式等待:

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.ID, "username"))
)