网站是:https://tw.mall.yahoo.com/item/玩美日記-水絲布面膜-25mL-玻尿酸-蘋果多酚-膠原胜月太-p066283079496
我想得到它的ID(例如:PXXXXXXXXX)。我使用BeautifulSoup尝试了几种不同的方法,包括一个不同的html解析器,但这些方法都没有成功。 代码:
<ul>
<li>商品編號:<span itemprop="productID">p066283079496</span></li>
<li>店家貨號:RTMK069C</li>
<li>購買人次:136</li>
<li>銷售件數:1337</li>
</ul>
我做到了:
class AppleCrawler(scrapy.Spider):
name ='apple'
start_urls = ['https://tw.mall.yahoo.com/152982163-category.html?img_only=0&sort_by=[rank]&order_by=0']
def parse(self, response):
res = BeautifulSoup(response.body)
for news in res.select('.P-18'):
yield scrapy.Request(news.select('a')[0]['href'],self.parse_detail)
def parse_detail(self, response):
res = BeautifulSoup(response.body)
print res.select('h1')[0].text
print ID# HOW?
print res.select('.price')[0].text,res.select('.store')[0].text