使用BeautifulSoup find_all从最后一个元素获取内容

时间:2014-08-26 02:10:37

标签: python beautifulsoup

我正在尝试从find_all创建的列表中的最后一个div中提取内容。

post_content = soup.find_all('div',{'class': 'body_content_inner'})

存储以下文字:

[<div class="body_content_inner">
 post #1 content is here
 </div>, <div class="body_content_inner">
 post #2 content is here
 </div>]

我想提取存储在最后一个div标签中的文字,但我不确定如何遍历post_content

2 个答案:

答案 0 :(得分:23)

html = """
<div class="body_content_inner">
 post #1 content is here
 </div>, <div class="body_content_inner">
 post #2 content is here
 </div>
  """
soup = BeautifulSoup(html)
print soup.find_all("div")[-1].get_text()
post #2 content is here

答案 1 :(得分:5)

last_div = None
for last_div in post_content:pass
if last_div:
    content = last_div.getText()

然后你得到post_content的最后一项。