在标记里面的美好的汤文本

时间:2018-02-23 05:16:43

标签: html python-3.x beautifulsoup tags

我正在尝试使用BeautifulSoup查询网页但遇到一些问题。我已经打开网页并使用

阅读html
html1 = urllib.request.urlopen(var).read()
soup = BeautifulSoup(html1,'html.parser')

当我打印汤时,我会得到一整份文字,我觉得这很正常......

我现在想要做的是找到与我的目标相关的文本的特定部分。我注意到我感兴趣的部分(标签)以字母“br /".

开头

我添加了以下代码,尝试在“br /”中获取文本:

tags1 = soup('br')

for tag in tags1:
    tag.get('br', None)
    print(tag)

但输出似乎只是标签本身,而不是那些标签内的文字。

我真的很感激有关如何获取该文本的任何建议。如果这是一个非常基本的问题,请道歉。

谢谢

1 个答案:

答案 0 :(得分:0)

要从标记中获取文本,请使用tag.text

found_tags = soup.find_all('br')

for tag in found_tags:
    print(tag.text)