遍历嵌套表并将列值打印到控制台

时间:2020-06-26 20:20:40

标签: python python-3.x selenium html-table headless

初学者程序员从测试无头的webscraping python和selenium程序开始,该程序将从嵌套表中的特定列打​​印数据到控制台。

在尝试运行以下代码之前,我的测试一直很成功

for row in browser.find_elements_by_xpath("//table/tbody/tr/td/div/div/div[2]/div[2]/table/tbody/tr/td/div/table[2]/tbody/tr"):
    for cell in row.find_elements_by_xpath("//td[4]"):
        link = cell.find.element_by_tag_name("a").text()
        pp.pprint(link)

我收到的错误消息是“ FirefoxWebElement”对象没有属性“查找”

我已经参考其他指南来引用嵌套表中的数据,并且可以确认xpath是正确的,因为只要我只在寻找一个元素,就可以将字符串打印到控制台。当我尝试使用此for循环遍历表的最后一行时,似乎就出现了问题。

作为参考,我正在尝试打印在每一行的单元格4中找到的超链接文本,直到表末尾。如果可能的话,我什至想从第二行开始进行迭代,因为第一个tr只是我不需要的标头信息

|cell 1|cell 2|cell 3|Hyperlink|cell 5|
|cell 1|cell 2|cell 3|Hyperlink|cell 5|
|cell 1|cell 2|cell 3|Hyperlink|cell 5|
...
etc.

除了导入和无头浏览器和webDriver设置之外,这是迄今为止项目中唯一的代码。最终,我希望在“新选项卡”中打开我要查找的超链接,然后开始类似的过程,但是我从这里的第一步开始。我只想确认我可以打印这些链接并参考正确的数据,然后再进行更高级的操作。

谢谢

0 个答案:

没有答案