网站刮板

时间:2014-12-19 22:17:07

标签: python web-scraping

是否可以检索值

data-price="4.7056"

来自以下html

 '<tr style="cursor:pointer;" class="percent_price_list price_list_content" data-count="500" data-price="4.7056">
                <td class="quick_list_count">500k</td>
                <td>£4.71</td>
                <td>£23.53</td>
            </tr>'

如果是这样我应该怎么做呢我知道如何在两个html标签之间正常抓取信息,但不知道如何得到上面提到的内容。我知道美丽的汤库,这在这种情况下会有用吗?

2 个答案:

答案 0 :(得分:1)

BeautifulSoup是一个HTML解析器。以下内容可以帮助您入门:

from bs4 import BeautifulSoup

html = """<tr style="cursor:pointer;" class="percent_price_list price_list_content" data-count="500" data-price="4.7056">
                <td class="quick_list_count">500k</td>
                <td>£4.71</td>
                <td>£23.53</td>
            </tr>"""
soup = BeautifulSoup(html)
for item in soup.find_all('tr', {'data-price': True}):
    print(item['data-price'])

# 4.7056

答案 1 :(得分:0)

是的,BeautifulSoup可以实现这一点,并在this answer中介绍。你试图通过它的声音来获取标签的价值。

其他问题的片段:

print soup.find('span', {"class":"thisClass"})['title']

编辑:对于代码格式化,很抱歉,移动应用程序存在问题。