我正在寻找一种从以下源代码中提取字符串 Title Name 的方法:
<div class="specs__party-group">
<a href="Url" title="Title Name" class="specs__party" data-no-translate="true">General
</a>
</div>
使用的软件包是BeautifoulSoup4。在源代码中,有多个
<a title = ... </a>
结构。例如:
<div class="show-more__fade js_show-more-button">
<a href="#" title="showmore">
</a>
</div>
</div>
但是,我只想要class="specs__party-group"
块中的标题字符串。
以下代码(在此处找到)没有给我想要的结果:
title = soup.find_all('a', title=True, class_='specs__party-group')
或
for link in soup.find_all('div', attrs={'class': 'specs__party-group'}):
title= link.get('title')
还有其他建议吗?
答案 0 :(得分:2)
您定位的标签带有“ specs__party”类,而不是“ specs__party-group”类。
这应该有效:
title = soup.find_all('a', class_='specs__party')