我希望点击next
按钮直到结束并抓取页面的所有来源。我的代码如下:
from selenium import webdriver
from selenium.common import exceptions
from selenium.webdriver.common.keys import Keys
import time
browser = webdriver.Firefox()
browser.get('https://s.taobao.com/search?q=%E5%8F%A3%E7%BD%A9+%E9%9D%A2%E7%BA%B1')
sources = []
for i in range(100):
sources.append(browser.page_source)
browser.find_element_by_css_selector("li.item.next > a.J_Ajax.num.icon-tag").click()
time.sleep(8)
browser.quit()
但所有来源都来自第一页,当我已经在每页等待8秒时,我看到图像已完成加载。你能告诉我是什么原因,我该如何解决?谢谢!
答案 0 :(得分:0)
我认为页面上显示的搜索结果是AJAX,因此您无法在HTML源代码中看到它们,因为AJAX是动态的并且只存储在内存中。
您可以通过查找DOM中的元素来访问数据,例如使用CSS定位器。