我在以下网站上使用scrapy以获取足球比赛网址。 http://www.spox.com/de/daten/?sport=soccer&page=season&id=9643&view=matches
到目前为止,它显示了所显示的25个匹配的所有URL,但是有一个“后退”(“Zurück”)按钮来显示更多匹配,但它使用相同的URL。那么我如何告诉scrapy按下该按钮并获取匹配的URL?
答案 0 :(得分:1)
按下后退按钮时,浏览器会生成XMLHttpRequest
。我建议在按下后退按钮后启动浏览器的控制台并检查网络流量。您将看到页面从中获取数据的URL。使用该URL进行进一步抓取。