scrapy相同的url不同的源内容

时间:2016-01-22 13:41:25

标签: scrapy

我在以下网站上使用scrapy以获取足球比赛网址。 http://www.spox.com/de/daten/?sport=soccer&page=season&id=9643&view=matches

到目前为止,它显示了所显示的25个匹配的所有URL,但是有一个“后退”(“Zurück”)按钮来显示更多匹配,但它使用相同的URL。那么我如何告诉scrapy按下该按钮并获取匹配的URL?

1 个答案:

答案 0 :(得分:1)

按下后退按钮时,浏览器会生成XMLHttpRequest。我建议在按下后退按钮后启动浏览器的控制台并检查网络流量。您将看到页面从中获取数据的URL。使用该URL进行进一步抓取。