我正在抓取一个网站,但在获取跨度文本时遇到了麻烦。我已经看到您可以在下面使用它来获取文本:
<span title="9 gold badges"><span class="badge1"></span><span class="badgecount">9</span></span>
badges = soup.body.find('div', attrs={'class': 'badges'})
for span in badges.span.find_all('span', recursive=False):
print span.attrs['title']
但是,我感兴趣的跨度没有属性。我如何获得短信?
<span>Geolocation: 35.1391, -90.0536</span>
答案 0 :(得分:0)
tag.text或tag.get_text()
ReportRequest
示例输出:
for span in badges.span.find_all('span', recursive=False):
print span.text
答案 1 :(得分:0)
要获取所有没有属性的span标签,请尝试以下代码段:
for span in badges.span.find_all('span', recursive=False):
if not span.attrs.values():
print (span.text)
希望这对您有用。