我正在抓捕https://cadres.apec.fr/home/mes-offres/recherche-des-offres-demploi/liste-des-offres-demploi.html?motsCles=commercial&sortsType=SCORE&sortsDirection=DESCENDING&lieux=590711 这个网站,我在提取文字时遇到问题。
我尝试了各种方法但徒劳
import scrapy
from scrapy_splash import SplashRequest
class QuotesSpider(scrapy.Spider):
name = "hi"
start_urls = [
'https://cadres.apec.fr/home/mes-offres/recherche-des-offres-demploi/liste-des-offres-demploi.html?motsCles=commercial&sortsType=SCORE&sortsDirection=DESCENDING&lieux=590711'
]
def start_requests(self):
for url in self.start_urls:
yield SplashRequest(url=url, callback=self.parse)
def parse(self, response):
name = response.css('span.offre.intitule::text').extract()
list = {"Name":name}
yield list
任何人都可以调查并帮助我吗?
答案 0 :(得分:1)
我认为您的css选择器是错误的,因为您正在使用offre.intitule
属性的值。所以也许像这样:
bo-text