在beautifulsoup中找到特定的文字

时间:2014-10-03 17:17:44

标签: python beautifulsoup

我有一段特定的文字我试图使用BeautifulSoup和Python,但我不知道如何使用sou.find()来获取它。

我只想从以下方面获得“美丽的第一名”。

<ul>
<li>...<li>
<li>...<li>
<li id="salesRank">
    <b>Amazon Best Sellers Rank:</b>
    "#1 in Beauty ("
    <a href="http://www.amazon.com/gp/bestsellers/beauty/ref=pd_dp_ts_k_1"> See top 100</a>
    ")

任何人都可以帮我吗?

1 个答案:

答案 0 :(得分:0)

您需要使用soup的{​​{3}}方法。请尝试以下

import urllib, urllib2
from bs4 import BeautifulSoup, Comment
url='your url here'
content = urllib2.urlopen(url).read()
soup = BeautifulSoup(content, "html.parser")
print soup.find_all('#1 in Beauty')