Question

我正在尝试使用BeautifulSoup查询网页但遇到一些问题。我已经打开网页并使用

阅读html

html1 = urllib.request.urlopen(var).read()
soup = BeautifulSoup(html1,'html.parser')

当我打印汤时，我会得到一整份文字，我觉得这很正常......

我现在想要做的是找到与我的目标相关的文本的特定部分。我注意到我感兴趣的部分（标签）以字母“br /".

开头

我添加了以下代码，尝试在“br /”中获取文本：

tags1 = soup('br')

for tag in tags1:
    tag.get('br', None)
    print(tag)

但输出似乎只是标签本身，而不是那些标签内的文字。

我真的很感激有关如何获取该文本的任何建议。如果这是一个非常基本的问题，请道歉。

谢谢

Answer 1

要从标记中获取文本，请使用tag.text：

found_tags = soup.find_all('br')

for tag in found_tags:
    print(tag.text)