从BeautifulSoup标记元素中提取文本

时间:2017-01-23 12:59:28

标签: python python-3.x beautifulsoup

我需要额外添加<div>中存储的发布日期。

,例如,

<div class="volltextDetails"><meta content="2016-01-27T19:03:18+01:00" itemprop="datePublished"/>OTS0258, 27. Jan. 2016, 19:03</div>

我设法用bs4找到它:

 soup.find("div", {"class": "volltextDetails"})

但我真的无法弄清楚如何获取存储在2016-01-27T19:03:18+01:00中的日期(meta content)。

我该怎么做?

1 个答案:

答案 0 :(得分:1)

soup.find("div", {"class": "volltextDetails"}).meta['content']
|----------this will return div tag---------|go to meta and get content|

出:

'2016-01-27T19:03:18+01:00'

navigating-the-tree