我试图用不同的网页搜索一个名为iens的网站。现在我能够成功地抓一页。
到目前为止我的代码:
chrome_path = '/Users/username/Downloads/chromedriver'
driver = webdriver.Chrome(chrome_path)
url = 'https://www.iens.nl/restaurant'
pageExt = '#page='
restaurantList = []
cityList = ['utrecht']
def scrape(pageNumber):
driver.get(url + '+' + cityList[0] + pageExt + str(pageNumber))
items = driver.find_elements_by_class_name("resultItem-
information")
for item in items:
restaurantList.append(item.text)
return restaurantList
print scrape(14)
这给了我需要的结果。但是,当我想刮掉这样的多个页面时:
print scrape(12)
print scrape(14)
我在网页12上获得了正确的数据结果,但是我没有得到网页14的结果,而是收到以下错误消息:
selenium.common.exceptions.StaleElementReferenceException: Message:
stale element reference: element is not attached to the page document
该页面名为https://www.iens.nl/restaurant+utrecht
你可以帮帮我吗?提前致谢!
答案 0 :(得分:0)
此问题似乎每个页面只会随机重现一次。您可以试试这段代码,让我知道它是否按预期工作:
import time
def scrape(pageNumber):
driver.get(url + '+' + cityList[0] + pageExt + str(pageNumber))
time.sleep(1)
items = driver.find_elements_by_class_name("resultItem-information")
for item in items:
restaurantList.append(item.text)