我正在解析的html文件具有多个completeExceptionally(new TimeoutException())
标签,如下所示:
<p>
在此打印第一段文字:<p>first text</p>
<p>...</p>
<p>...</p>
<p>...</p>
<p>...</p>
<p>my text</p>
first text
如何打印最后一个:print (soup.find("section", {"id": "posts"}).article.div.p.text)
答案 0 :(得分:1)
使用find_all
获取所有p作为列表,获取最后一个元素,然后引用其text属性
soup.find("section", {"id": "posts"}).article.div.find_all('p')[-1].text
答案 1 :(得分:0)
可以使用find_next_siblings
方法解决该问题:
例如提取第四个<p>
标签
l1 = soup.find("section", {"id": "posts"}).article.div.p
l2 = l1.find_next_sibling('p')
l2 = l2.find_next_sibling('p')
l2 = l2.find_next_sibling('p')
print (l2.text)