我试图通过本网站获得奥巴马2009年的演讲:
http://www.presidency.ucsb.edu/ws/index.php?pid=85753
看起来表格中有多个表格,我似乎无法通过beautifulsoup浏览它以获取他演讲的文本。
有什么想法吗?
答案 0 :(得分:1)
搜索class="displaytext"
并获取父<td>
,然后遍历&#39; <p>
&#39;标签。
答案 1 :(得分:0)
你可以尝试:
the_soup.select('span.displaytext')[0].text