我想报废这部分

时间:2019-03-10 14:41:26

标签: python-3.x web-scraping scrapy

我正在尝试抓取屏幕截图中的每个面板,但是我没有正确的xpath来抓取那些部分。任何人都可以帮助我。

enter image description here

https://www.seloger.com/annonces/achat/appartement/paris-15eme-75/saint-lambert/142632059.htm?cp=75&idtt=2,5&idtypebien=2,1&LISTING-LISTpg=2&naturebien=1,2,4&tri=initial&

1 个答案:

答案 0 :(得分:1)

此数据从其他请求中提取到https://www.seloger.com/detail,json,caracteristique_bien.json?idannonce=142632059。在那里,您将获得带有完整信息的json。

UPD:

url_id = re.search(r'/(\d+)\.htm', response.url).group(1)
details_url = 'https://www.seloger.com/detail,json,caracteristique_bien.json?idannonce={}'
# make request to url
yield Request(details_url.format(url_id))