下面的代码从网页中的表获取数据。
在翻过一页后,它会转到下一页并再次执行相同的操作。移至下一页时,页面的URL不变。
我想使用一个循环,使其连续运行50或75次并中断。
driver.get(site)
mytable = driver.find_element_by_css_selector('.table.table...nline')
for row in mytable.find_elements_by_css_selector('tr'):
for cell in row.find_elements_by_tag_name('td'):
sys.stdout=open("abcd.txt","a+")
print(cell.text)
sys.stdout.close()
driver.find_element_by_xpath("//li[@class='button next']/a").click()
我尝试使用while循环,但是在附加文件时遇到问题。
答案 0 :(得分:1)
尝试切片:
driver.get(site)
mytable = driver.find_element_by_css_selector('.table.table...nline')
for row in mytable.find_elements_by_css_selector('tr')[:50]:
for cell in row.find_elements_by_tag_name('td'):
sys.stdout=open("abcd.txt","a+")
print(cell.text)
sys.stdout.close()
driver.find_element_by_xpath("//li[@class='button next']/a").click()