Question

我是Python和漂亮汤的新手。任何人都可以帮助并回答如何从此html代码中提取一个小时？

<a class="hour-link fancybox-reservation" href="/47,Lodz/Seans/info/seans/CC527207-4B9C-45CD-812F-3501A647E1B3/dzien/146231/film/16892">12:20</a>

输出应为：12:20

谢谢您提前获得所有答案！

Answer 1

您可以尝试：

>>> from bs4 import BeautifulSoup as bs

>>> data = """<a class="hour-link fancybox-reservation" href="/47,Lodz/Seans/info/seans/CC527207-4B9C-45CD-812F-3501A647E1B3/dzien/146231/film/16892">12:20</a>"""

>>> soup = bs(StringIO(data))
>>> a_tag = soup.find_all('a')

>>> a_tag[0]
<a class="hour-link fancybox-reservation" href="/47,Lodz/Seans/info/seans/CC527207-4B9C-45CD-812F-3501A647E1B3/dzien/146231/film/16892">12:20</a>

>>> a_tag[0].text
'12:20'

Answer 2

看看Soup documentation并尝试先自己制定答案。我建议您看看示例中的find_all('a')和.text功能。

如何使用python和漂亮的汤从html代码中提取一个小时

2 个答案: