我该如何解决,因为它没有返回文本?

时间:2019-08-07 21:07:09

标签: web-scraping scrapy scrapy-splash

我正在抓捕https://cadres.apec.fr/home/mes-offres/recherche-des-offres-demploi/liste-des-offres-demploi.html?motsCles=commercial&sortsType=SCORE&sortsDirection=DESCENDING&lieux=590711 这个网站,我在提取文字时遇到问题。

我尝试了各种方法但徒劳

import scrapy
from scrapy_splash import SplashRequest


class QuotesSpider(scrapy.Spider):
    name = "hi"
    start_urls = [
        'https://cadres.apec.fr/home/mes-offres/recherche-des-offres-demploi/liste-des-offres-demploi.html?motsCles=commercial&sortsType=SCORE&sortsDirection=DESCENDING&lieux=590711'
    ]

    def start_requests(self):
        for url in self.start_urls:
            yield SplashRequest(url=url, callback=self.parse)

    def parse(self, response):
        name = response.css('span.offre.intitule::text').extract()
        list = {"Name":name}
        yield list

任何人都可以调查并帮助我吗?

1 个答案:

答案 0 :(得分:1)

我认为您的css选择器是错误的,因为您正在使用offre.intitule属性的值。所以也许像这样:

bo-text