我是一个Python新手,正在开发一个有趣的小型抓取项目。试图从这里提取信息: http://www.airfleets.net/flottecie/American%20Airlines.htm
我使用的是Python 2并使用Selenium
页面上有一张表格,上面有飞机的详细信息。我想迭代这个表的第二列,标记为“活动”。通常,我会使用find_element_by_id
选择表格。但是,此表没有id
标记。我想我需要通过find_element_by_xpath
找到该表,但我不确定找到该表的路径语法,还有第二列中的行。
总之,如果表中没有任何标识标记,我如何遍历表的行?
答案 0 :(得分:4)
您可以使用CSS选择器或XPath。正如评论中所提到的,您的浏览器的开发工具可能有内置的方法来实现这一点。
该表的Xpath是
/html/body/table[4]/tbody/tr[1]/td/table[2]/tbody/tr/td[2]/table
您可以使用的CSS选择器是
body > table:nth-child(6) > tbody > tr:nth-child(1) > td > table:nth-child(3) > tbody > tr > td:nth-child(2) > table
例如,在Chrome中,您可以通过以下方式获取此信息:
(1)打开开发工具并找到元素。您可以通过右键单击任何元素并单击“检查”
来执行此操作