如何使用Import.io抓取多个页面

时间:2015-07-30 07:23:04

标签: web-scraping scrape import.io

我正在尝试从网站http://www.cityoflondon.gov.uk/events/抓取一个事件列表,但是当使用import.io删除它时,我只能提取第一页。

我怎么能一次提取所有页面?

1 个答案:

答案 0 :(得分:3)

您可以使用此抓取工具或使用批量提取来使用此网站提取数据。以上网站使用了一种非常简单的分页形式:

http://www.cityoflondon.gov.uk/events/Pages/default.aspx    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=13    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=49    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=25    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=37  

以下是我为上述网址创建的数据集,其中应包含所有相关信息。

319aebad-88ea-4053-a649-2087011ce041

如果您对某个网站有疑问,请联系support@import.io

谢谢! 梅格