Python Selenium:如何提取outerHTML

时间:2018-10-04 12:48:28

标签: python selenium web-scraping

我正在使用Python Selenium抓取网页,并且很难找到感兴趣的元素。一页上有很多感兴趣的元素,理想情况下,我想将所有元素提取为数组中的字符串。 HTML代码如下所示(浅蓝色突出显示的部分是我需要找到的许多元素之一):

enter image description here

到目前为止,我已经尝试过以下语句:

enter image description here

第一个返回一个空对象。第二个返回意外结果:

enter image description here

感谢您的协助。

1 个答案:

答案 0 :(得分:1)

如果要将链接的 outerHTML 保存为 string ,请尝试

driver.find_element_by_css_selector('a.ng-binding').get_attribute('outerHTML')

如果有多个链接,并且每个链接都需要结果:

[link.get_attribute('outerHTML') for link in driver.find_elements_by_css_selector('a.ng-binding')]