使用Python和beautifulsoup4从特定的td返回文本

时间:2018-07-16 11:15:46

标签: python html beautifulsoup

我想从“值”类返回文本,但是我的问题是,表中有多个td标签,它们的类为“值”,并且文本包含“模块时间:”。因此,当整个表中的类名相同时,如何返回结果/文本,唯一的区别是结果本身。

HTML:

<tr>
<td class='label' style="border-color:#000000;background-color:#FFFFFF;">Module Time:             
</td>
<td class='value' style="border-color:#000000;background-color:#32FFFF;">1.4165606
</td>
</tr>

例如,上面摘录下面的几行代码是这样的:

<tr>
<td class='label' style="border-color:#000000;background-color:#FFFFFF;">Module Time:              
</td>
<td class='value' style="border-color:#000000;background-color:#32FFFF;">0.100279
</td>
</tr>

所以我只想从第一个HTML代码段返回结果。

1 个答案:

答案 0 :(得分:0)

回答:

我只需要使用切片。

module_time = soup.find_all("td", text="Module Time:              ")[30].find_next_sibling("td").text