如何使用python和漂亮的汤从html代码中提取一个小时

时间:2019-12-12 14:21:24

标签: python html beautifulsoup

我是Python和漂亮汤的新手。 任何人都可以帮助并回答如何从此html代码中提取一个小时?

<a class="hour-link fancybox-reservation" href="/47,Lodz/Seans/info/seans/CC527207-4B9C-45CD-812F-3501A647E1B3/dzien/146231/film/16892">12:20</a>

输出应为:12:20

谢谢您提前获得所有答案!

2 个答案:

答案 0 :(得分:0)

您可以尝试:

>>> from bs4 import BeautifulSoup as bs

>>> data = """<a class="hour-link fancybox-reservation" href="/47,Lodz/Seans/info/seans/CC527207-4B9C-45CD-812F-3501A647E1B3/dzien/146231/film/16892">12:20</a>"""

>>> soup = bs(StringIO(data))
>>> a_tag = soup.find_all('a')

>>> a_tag[0]
<a class="hour-link fancybox-reservation" href="/47,Lodz/Seans/info/seans/CC527207-4B9C-45CD-812F-3501A647E1B3/dzien/146231/film/16892">12:20</a>

>>> a_tag[0].text
'12:20'

答案 1 :(得分:0)

看看Soup documentation并尝试先自己制定答案。我建议您看看示例中的find_all('a').text功能。