Question

我对python很陌生，所以如果这是一个简单的解决方法，我会提前道歉。我正在尝试刮擦此处显示的表格：https://www.opensecrets.org/lobby/lobbyist.php?id=Y0000008510L&year=2018 这是我正在使用的代码：

import requests
page=requests.get("https://www.opensecrets.org/lobby/lobbyist.php?id=Y0000008510L&year=2018")
from bs4 import BeautifulSoup
soup=BeautifulSoup(page.content, 'html.parser')
table=soup.table

但是，它不能识别整个表格。这是python的print（table）输出：

   <table class="datadisplay" id="lobbyist_summary" style="margin-top:40px;">
<thead><tr><th class="data">Lobbying Firm</th></tr></thead></table>

如何识别整个表格？最终，我希望得到一个与网页上的表格极为相似的.txt或.csv文件，但目前我仍然处于这一步。任何帮助，将不胜感激。

使用beautifulsoup抓取不完整的表格

0 个答案: