使用漂亮的肥皂刮网时缺少值

时间:2019-07-29 05:21:51

标签: python web-scraping

我想从下面的html摘录中提取值:

<html>
 <body>
  <td class="rel">
   <div class="ss1 abs lbl_l" style="top:0px;">
    P/E
    <sup>
     4
    </sup>
    <div class="icon-edu icon-general-terms" data-key="P/E Ratio" style="display:none">
    </div>
   </div>
   <div class="ss2 abs lbl_r font-num cls" style="top:0px;">
    35.520
   </div>
  </td>
 </body>
</html>
    page = urllib.request.urlopen(durl)
    soup = BeautifulSoup(page, 'html5lib')
    result = soup.find_all("div", class_="ss2 abs lbl_r font-num cls")

我得到的是下面的东西。数字35.520丢失:

[<div class="ss2 abs lbl_r font-num cls" style="top:0px;"></div>,
 <div class="ss2 abs lbl_r font-num cls" style="top:0px;"></div>,
 <div class="ss2 abs lbl_r font-num cls" style="top:0px;"></div>,
 <div class="ss2 abs lbl_r font-num cls" style="top:0px;"></div>]

我尝试使用另一个解析器,例如html.parserlxml,同样。

0 个答案:

没有答案