我有一个包含6个表行的HTML表:
<table>
<tr>
<th>1</th>
<td><p>1</p></td>
</tr>
<tr>
<th>2</th>
<td><p>2</p></td>
</tr>
<tr>
<th>3</th>
<td><p>3</p></td>
</tr>
<tr>
<th>4</th>
<td><p>4</p></td>
</tr>
<tr>
<th>5</th>
<td><p>5</p></td>
</tr>
<tr>
<th>6</th>
<td><p>6</p></td>
</tr>
</table>
我的目标是仅提取前5行。
如何在python中对其进行编码,以便在获取前5行后BeautifulSoup中断?
答案 0 :(得分:2)
您可以使用limit
中的findAll
kwarg仅抓取第一个n
元素
from bs4 import BeautifulSoup
soup = BeautifulSoup(html)
trs = soup.find('table').findAll('tr', limit=5)