使用beautifulsoup抓取不完整的表格

时间:2018-08-31 18:55:34

标签: python beautifulsoup

我对python很陌生,所以如果这是一个简单的解决方法,我会提前道歉。 我正在尝试刮擦此处显示的表格:https://www.opensecrets.org/lobby/lobbyist.php?id=Y0000008510L&year=2018 这是我正在使用的代码:

import requests
page=requests.get("https://www.opensecrets.org/lobby/lobbyist.php?id=Y0000008510L&year=2018")
from bs4 import BeautifulSoup
soup=BeautifulSoup(page.content, 'html.parser')
table=soup.table

但是,它不能识别整个表格。这是python的print(table)输出:

   <table class="datadisplay" id="lobbyist_summary" style="margin-top:40px;">
<thead><tr><th class="data">Lobbying Firm</th></tr></thead></table>

如何识别整个表格?最终,我希望得到一个与网页上的表格极为相似的.txt或.csv文件,但目前我仍然处于这一步。任何帮助,将不胜感激。

0 个答案:

没有答案