我怎样才能在Beautifulsoup中了解父母的班级姓名?

时间:2018-04-07 14:27:33

标签: python beautifulsoup

我的HTML看起来像这样,我想分别检索“INFO”。

<tr tabindex = "0">
<td data-name = "isu_srt_cd">"INFO"</td>
<td data-name = "com_abbrv">"INFO"</td>
...
<td data-name = "etf_obj">"INFO"</td>
</tr>

到目前为止我所做的如下,

for ana in soup.find_all("td"):
    if ana.parent.name == "tr":
        print(ana.get_text())

这几乎已经完成,但我想指定父母的“tabindex”为“0”

2 个答案:

答案 0 :(得分:2)

找到您感兴趣的所有<tr>,然后获取其下面的所有<td>

for tr in soup.find_all("tr", tabindex='0'):
    for ana in tr.find_all('td'):
        print(ana.get_text())

答案 1 :(得分:1)

您可以使用CSS selectors

for td in soup.select("tr[tabindex='0'] > td"):
    print(td.text)