我正在尝试从find_all创建的列表中的最后一个div中提取内容。
post_content = soup.find_all('div',{'class': 'body_content_inner'})
存储以下文字:
[<div class="body_content_inner">
post #1 content is here
</div>, <div class="body_content_inner">
post #2 content is here
</div>]
我想提取存储在最后一个div标签中的文字,但我不确定如何遍历post_content
答案 0 :(得分:23)
html = """
<div class="body_content_inner">
post #1 content is here
</div>, <div class="body_content_inner">
post #2 content is here
</div>
"""
soup = BeautifulSoup(html)
print soup.find_all("div")[-1].get_text()
post #2 content is here
答案 1 :(得分:5)
last_div = None
for last_div in post_content:pass
if last_div:
content = last_div.getText()
然后你得到post_content的最后一项。