有没有办法在Scrapy中搜索关键字

时间:2019-06-25 13:36:45

标签: python scrapy

我正在抓取一个网站,我需要从网站上获取卖方信息,但与其列出卖方的名称,不如使用带有徽标的徽标,因此我打算抓取整个图像,但在仔细检查后,我注意到里面与图片网址相同的代码,它们具有公司的实际名称,如下图所示。当我抓取HTML时,是否有一种方法可以搜索HTML的那一行,以便仅获取“ title =“和d”>”之间的文本。

def parse(self, response):
        for game in response.css('div.card > div.row'):
            item = GameItem()
            item["Category"] = game.css("div.col-12.prod-cat a::text").get()
            item["Card_Name"]  = game.css("a.card-text::text").get()
            for buying_option in game.css('div.buying-options-table div.row:not(:first-child)'):
                item["Seller"] = buying_option.css("div.col-3.text-center.p-1 img").get()
                item["Condition"] = buying_option.css("div.col-3.text-center.p-1::text").get()
                item["Price"] = buying_option.css("div.col-2.text-center.p-1::text").get()
                yield item

Screenshot of website

1 个答案:

答案 0 :(得分:1)

element::attr(value)选择元素属性。例如: a::attr('href')选择href元素的a属性。 尝试使用此选择器提取title值:

response.css('div.row.align-center.py-2.m-auto > div.col-3.text-center.p-1 > img::attr(title)').get()