我正在使用Python中的Selenium Chromedriver进行网络报废。现在,当我尝试获取数据时,网格(可水平滚动),我只能在浏览器中看到网格的可见部分。
对于前。在这里我只能得到Part Category
之前的数据,就像这样
['', '', '', '', '', 'Item Number', 'Item Description', 'Lifecycle Phase', 'Old Lifecycle Phase', 'Docs Rqd', 'PGDS Audit', 'Part Category', '', '', '', '', '', '', '', '', '', '', '', '', '']
虽然确实存在更多列。
我尝试了actions.move_to_element
,driver.execute_script
但没有工作。
这是我的示例代码
for i in range(len(titles)):
current_tab = driver.find_elements_by_xpath("//div[@id='tabsDiv']/ul/li/a")[i:i+1]
current_tab_name=current_tab[0].text
current_tab[0].click()
time.sleep(5)
if(current_tab_name=='Affected Items'):
current_tab_info=driver.find_elements_by_xpath("//div[@class='GMHeadMid']/table[@class='GMSection']/tbody/tr[@class='GMHeaderRow']/td") ## this is the scroll-able grid
driver.execute_script("window.scrollTo(0, 100)")
#current_tab_info[0].location_once_scrolled_into_view
#actions = ActionChains(driver)
#actions.move_to_element(current_tab_info[0]).perform()
current_tab_header_list=[x.text for x in current_tab_info]
print(current_tab_header_list)
答案 0 :(得分:0)
为什么不让驱动程序滚动到元素而不是水平滚动?
scrollToElement = "arguments[0].scrollIntoView()"
driver.execute_script(scrollToElement, current_tab_info)
我不是python期望的,所以我的语法可能有问题。
答案 1 :(得分:0)
最后我得到了一个解决方法
# First of all get all the header column span IDs
current_tab_info = driver.find_elements_by_xpath("//div[@class='GMHeadMid']/table[@class='GMSection']/tbody/tr[@class='GMHeaderRow']/td/div/span")
current_tab_header_list = [x.get_attribute('id') for x in current_tab_info]
# Then get element text against each ID
current_tab_header_label_list =[]
for i in current_tab_header_list:
# will scroll until that element is not appeared on page
current_header_info = driver.find_elements_by_xpath(
"//div[@class='GMHeadMid']/table[@class='GMSection']/tbody/tr[@class='GMHeaderRow']/td/div/span[@id='"+str(i)+"']")
driver.execute_script("arguments[0].scrollIntoView(true);", current_header_info[0])
current_tab_header_label_list.append(current_header_info[0].text)