Question

初学者程序员从测试无头的webscraping python和selenium程序开始，该程序将从嵌套表中的特定列打印数据到控制台。

在尝试运行以下代码之前，我的测试一直很成功

for row in browser.find_elements_by_xpath("//table/tbody/tr/td/div/div/div[2]/div[2]/table/tbody/tr/td/div/table[2]/tbody/tr"):
    for cell in row.find_elements_by_xpath("//td[4]"):
        link = cell.find.element_by_tag_name("a").text()
        pp.pprint(link)

我收到的错误消息是“ FirefoxWebElement”对象没有属性“查找”

我已经参考其他指南来引用嵌套表中的数据，并且可以确认xpath是正确的，因为只要我只在寻找一个元素，就可以将字符串打印到控制台。当我尝试使用此for循环遍历表的最后一行时，似乎就出现了问题。

作为参考，我正在尝试打印在每一行的单元格4中找到的超链接文本，直到表末尾。如果可能的话，我什至想从第二行开始进行迭代，因为第一个tr只是我不需要的标头信息

|cell 1|cell 2|cell 3|Hyperlink|cell 5|
|cell 1|cell 2|cell 3|Hyperlink|cell 5|
|cell 1|cell 2|cell 3|Hyperlink|cell 5|
...
etc.

除了导入和无头浏览器和webDriver设置之外，这是迄今为止项目中唯一的代码。最终，我希望在“新选项卡”中打开我要查找的超链接，然后开始类似的过程，但是我从这里的第一步开始。我只想确认我可以打印这些链接并参考正确的数据，然后再进行更高级的操作。

谢谢

遍历嵌套表并将列值打印到控制台

0 个答案: