使用BeautifulSoup获取日期

时间:2015-04-02 12:54:01

标签: python beautifulsoup

我对Python很陌生。我试图抓取一个网站获取信息,主要是文字,但我遇到了日期问题。它看起来像这样:

<time class="jlist_date_image" datetime="2015-04-02 14:30:12">Idag <span class="list_date">14:30</span></time>

我想要的是&#34; 2015-04-02 14:30:12&#34;。我的问题不是文字。任何人都可以帮助我。

谢谢!

2 个答案:

答案 0 :(得分:3)

from bs4 import BeautifulSoup

BeautifulSoup(strng).time.attrs['datetime']

答案 1 :(得分:2)

>>> from bs4 import BeautifulSoup
>>> s = '''<time class="jlist_date_image" datetime="2015-04-02 14:30:12">Idag <span class="list_date">14:30</span></time>'''
>>> soup = BeautifulSoup(s)
>>> for i in soup.findAll('time'):
        if i.has_attr('datetime'):
            print(i['datetime'])


2015-04-02 14:30:12