Question

网站是：https://tw.mall.yahoo.com/item/玩美日記-水絲布面膜-25mL-玻尿酸-蘋果多酚-膠原胜月太-p066283079496

我想得到它的ID（例如：PXXXXXXXXX）。我使用BeautifulSoup尝试了几种不同的方法，包括一个不同的html解析器，但这些方法都没有成功。代码：

<ul>
    <li>商品編號：<span itemprop="productID">p066283079496</span></li>
    <li>店家貨號：RTMK069C</li>
    <li>購買人次：136</li>
    <li>銷售件數：1337</li>
</ul>

我做到了：

class AppleCrawler(scrapy.Spider):
name ='apple'
start_urls = ['https://tw.mall.yahoo.com/152982163-category.html?img_only=0&sort_by=[rank]&order_by=0']
def parse(self, response):
    res = BeautifulSoup(response.body)
    for news in res.select('.P-18'):
        yield scrapy.Request(news.select('a')[0]['href'],self.parse_detail)            
def parse_detail(self, response):
    res = BeautifulSoup(response.body)
    print res.select('h1')[0].text
    print ID# HOW?
    print res.select('.price')[0].text,res.select('.store')[0].text

使用beautifulsoup

0 个答案: