我正在尝试使用BeautifulSoup查询网页但遇到一些问题。我已经打开网页并使用
阅读htmlhtml1 = urllib.request.urlopen(var).read()
soup = BeautifulSoup(html1,'html.parser')
当我打印汤时,我会得到一整份文字,我觉得这很正常......
我现在想要做的是找到与我的目标相关的文本的特定部分。我注意到我感兴趣的部分(标签)以字母“br /".
开头我添加了以下代码,尝试在“br /”中获取文本:
tags1 = soup('br')
for tag in tags1:
tag.get('br', None)
print(tag)
但输出似乎只是标签本身,而不是那些标签内的文字。
我真的很感激有关如何获取该文本的任何建议。如果这是一个非常基本的问题,请道歉。
谢谢
答案 0 :(得分:0)
要从标记中获取文本,请使用tag.text
:
found_tags = soup.find_all('br')
for tag in found_tags:
print(tag.text)