我对Python很陌生。我试图抓取一个网站获取信息,主要是文字,但我遇到了日期问题。它看起来像这样:
<time class="jlist_date_image" datetime="2015-04-02 14:30:12">Idag <span class="list_date">14:30</span></time>
我想要的是&#34; 2015-04-02 14:30:12&#34;。我的问题不是文字。任何人都可以帮助我。
谢谢!
答案 0 :(得分:3)
from bs4 import BeautifulSoup
BeautifulSoup(strng).time.attrs['datetime']
答案 1 :(得分:2)
>>> from bs4 import BeautifulSoup
>>> s = '''<time class="jlist_date_image" datetime="2015-04-02 14:30:12">Idag <span class="list_date">14:30</span></time>'''
>>> soup = BeautifulSoup(s)
>>> for i in soup.findAll('time'):
if i.has_attr('datetime'):
print(i['datetime'])
2015-04-02 14:30:12