我的HTML看起来像这样,我想分别检索“INFO”。
<tr tabindex = "0">
<td data-name = "isu_srt_cd">"INFO"</td>
<td data-name = "com_abbrv">"INFO"</td>
...
<td data-name = "etf_obj">"INFO"</td>
</tr>
到目前为止我所做的如下,
for ana in soup.find_all("td"):
if ana.parent.name == "tr":
print(ana.get_text())
这几乎已经完成,但我想指定父母的“tabindex”为“0”
答案 0 :(得分:2)
找到您感兴趣的所有<tr>
,然后获取其下面的所有<td>
。
for tr in soup.find_all("tr", tabindex='0'):
for ana in tr.find_all('td'):
print(ana.get_text())
答案 1 :(得分:1)
您可以使用CSS selectors。
for td in soup.select("tr[tabindex='0'] > td"):
print(td.text)