我有一个包含250行表格的页面。对于每一行,我需要处理一些信息并返回一些数据。我现在就是这样做的:
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('mypage')
rows = driver.find_elements_by_css_path('table')
for row in rows:
row.find_element_by_css_path('something')
row.find_element_by_css_path('something else')
etc.
请注意,我无法使用复数row
。find_elements_by_css_path
,因为每行我必须将一些逻辑应用于我需要抓取的内容。
这对我来说非常缓慢 - 处理页面大约需要一分钟。将html加载到漂亮的汤中做同样的事情需要大约十秒钟,但是给了我其他错误,所以我想留在'内'硒。
有没有办法加快速度?我无法控制html,因此我无法将css选择器更改为使用ID之类的内容。