BeautifoulSoup4从源代码中提取标题

时间:2018-11-16 15:44:32

标签: python web-scraping beautifulsoup

我正在寻找一种从以下源代码中提取字符串 Title Name 的方法:

<div class="specs__party-group">
    <a href="Url" title="Title Name" class="specs__party"  data-no-translate="true">General
    </a>
</div>

使用的软件包是BeautifoulSoup4。在源代码中,有多个

<a title = ... </a> 

结构。例如:

<div class="show-more__fade  js_show-more-button">
    <a href="#" title="showmore">
    </a>
  </div>
</div>

但是,我只想要class="specs__party-group"块中的标题字符串。

以下代码(在此处找到)没有给我想要的结果:

title = soup.find_all('a', title=True, class_='specs__party-group')

for link in soup.find_all('div', attrs={'class': 'specs__party-group'}): 
    title= link.get('title')

还有其他建议吗?

1 个答案:

答案 0 :(得分:2)

您定位的标签带有“ specs__party”类,而不是“ specs__party-group”类。

这应该有效:

title = soup.find_all('a', class_='specs__party')