Python BeautifulSoup4获取表行范围

时间:2017-09-08 15:10:38

标签: python beautifulsoup

我有一个包含6个表行的HTML表:

<table>
<tr>
<th>1</th>
<td><p>1</p></td>
</tr>
<tr>
<th>2</th>
<td><p>2</p></td>
</tr>
<tr>
<th>3</th>
<td><p>3</p></td>
</tr>
<tr>
<th>4</th>
<td><p>4</p></td>
</tr>
<tr>
<th>5</th>
<td><p>5</p></td>
</tr>
<tr>
<th>6</th>
<td><p>6</p></td>
</tr>
</table>

我的目标是仅提取前5行。

如何在python中对其进行编码,以便在获取前5行后BeautifulSoup中断?

1 个答案:

答案 0 :(得分:2)

您可以使用limit中的findAll kwarg仅抓取第一个n元素

from bs4 import BeautifulSoup
soup = BeautifulSoup(html)
trs = soup.find('table').findAll('tr', limit=5)