Question

以下是网页的一部分：

 <div class="MPinfo">
     <ul class="frontList">
         <li>some text</li>
         <li>some text</li>
         <li>some text</li>
         <li>some text</li>
         <li>some text</li>
         <li>some text
             <a href="/some_local_link/8976">some text</a>;
             <a href="/some_local_link/8943">some text</a>;
         </li>
         <li>E-mail: 
             <a href="mailto:Ss.Sssssss@mail.com">Ss.Sssssss@mail.com</a>
         </li>
     </ul>
 </div>

我正在尝试通过其类获取div，然后将电子邮件链接提取到电子邮件本身，如：Ss.Sssssss@mail.com

page = urllib.urlopen(link)
soup = BeautifulSoup(page.read())
print soup.find('div', attrs={'class': 'MPinfo'})

我尝试了几种获取div的方法，但它返回空列表或无

Answer 1

您可以选择div下的所有li，它将是一个列表，因此您可以选择最后一个li元素，如[-1]

>>> soup.find("div",attrs={"class":"MPinfo"}).find_all("li")[-1].a.text
'Ss.Sssssss@mail.com'

BeautifulSoup无法通过其类找到标签

1 个答案: