我正在使用selenium-python和PhantomJS。代码非常类似:
from selenium.webdriver import PhantomJS
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions
driver = PhantomJS()
wait = WebDriverWait(driver, 10)
driver.get(url)
while True:
// scrap the page
try:
driver.find_elements_by_css_selector('.next')[0].click()
except: break
wait.until(expected_conditions.visibility_of_element_located((By.CSS_SELECTOR, '.loading')))
wait.until(expected_conditions.invisibility_of_element_located((By.CSS_SELECTOR, '.loading')))
driver.quit()
我使用celery任务定期运行此代码。问题在于,有时会出现一些过时的幻影过程。当我查看芹菜日志时,任务成功完成,没有任何错误,但phantomjs进程仍在运行。
一些额外信息:
ln -s /opt/phantomjs/bin/phantomjs /usr/local/bin/
有人可以建议一种方法来调试并找出这是谁的错误吗?
答案 0 :(得分:2)
我之前没有使用过芹菜,你确定芹菜会为你显示所有的错误信息吗?对于您的代码,我认为如果在运行wait.until(...)
时发生异常,则不会执行driver.quit()
。