使用beautifulsoup

时间:2016-12-19 11:31:35

标签: python-2.7 url beautifulsoup

网站是:https://tw.mall.yahoo.com/item/玩美日記-水絲布面膜-25mL-玻尿酸-蘋果多酚-膠原胜月太-p066283079496

我想得到它的ID(例如:PXXXXXXXXX)。我使用BeautifulSoup尝试了几种不同的方法,包括一个不同的html解析器,但这些方法都没有成功。 代码:

<ul>
    <li>商品編號:<span itemprop="productID">p066283079496</span></li>
    <li>店家貨號:RTMK069C</li>
    <li>購買人次:136</li>
    <li>銷售件數:1337</li>
</ul>

我做到了:

class AppleCrawler(scrapy.Spider):
name ='apple'
start_urls = ['https://tw.mall.yahoo.com/152982163-category.html?img_only=0&sort_by=[rank]&order_by=0']
def parse(self, response):
    res = BeautifulSoup(response.body)
    for news in res.select('.P-18'):
        yield scrapy.Request(news.select('a')[0]['href'],self.parse_detail)            
def parse_detail(self, response):
    res = BeautifulSoup(response.body)
    print res.select('h1')[0].text
    print ID# HOW?
    print res.select('.price')[0].text,res.select('.store')[0].text

0 个答案:

没有答案