使用Scrapy遍历下拉列表

时间:2020-03-15 17:59:35

标签: python web-scraping scrapy

一个非常简单的问题,我如何遍历此下拉列表?我想我需要使用xpath,但是不确定如何使用。仅操纵URL会更容易吗? -是可以预见的。

这是我要从其中抓取的链接:http://www.southamptonweather.co.uk/wxhistory.php

这是我当前的代码:

import scrapy


class WeatherSpider(scrapy.Spider):
    name = "weatherspider"
    start_urls = [
        "http://www.southamptonweather.co.uk/wxhistory.php?date=201907"]

    def parse(self, response):
        for average_temprature in response.xpath('//td[text()="Average temperature"]/following-sibling::td/text()').extract():
            yield {
                "Average Temperature": average_temprature
            }

就目前而言,这正在拉动我需要的临时数据,我只想从每个日期追溯到2008年4月。

谢谢

八月

0 个答案:

没有答案