应用错误收集

Rubygem Crawling

时间：2018-06-06 21:18:54

标签： web-scraping web-crawler

我正在尝试抓取RubyGem存储库以获取有关包更新的信息。但是，我可以找到爬行整个存储库的唯一链接是一个sql文件，它会在每周结束时被转储。

由于内存/时间限制，这并不理想，我想知道是否有更好的方法或更有效的爬行方式，而无需手动读取数据库。

感谢您的帮助！

0 个答案:

没有答案