表格内的表格Beautifulsoup

时间:2015-05-08 05:49:08

标签: python web web-scraping beautifulsoup html-table

我试图通过本网站获得奥巴马2009年的演讲:

http://www.presidency.ucsb.edu/ws/index.php?pid=85753

看起来表格中有多个表格,我似乎无法通过beautifulsoup浏览它以获取他演讲的文本。

有什么想法吗?

2 个答案:

答案 0 :(得分:1)

搜索class="displaytext"并获取父<td>,然后遍历&#39; <p>&#39;标签。

答案 1 :(得分:0)

你可以尝试:

the_soup.select('span.displaytext')[0].text