如何从一种文件类型中收集大量文件?

时间:2014-12-10 21:37:55

标签: file download web-crawler fuzzing

我试图模糊一些工具,但我需要大量的.zip或.jpg文件。我尝试过像webripper这样的抓取工具,但它不是很有效(或者我做错了)。是否有更好的方法来获取大量不同的文件?

1 个答案:

答案 0 :(得分:0)

好吧,对于其他人可能需要这样的事情:

最后,我使用Webripper而不是使用"文件类型"生成google / bing结果的链接。参数我只是将一些上传/免费软件页面作为具有最大链接深度的目标rip作业。

Webripper有时可能会崩溃并且需要相当长的时间,但它有点工作。

可能更好的解决方案可能是使用谷歌API(例如c#SearchAPI)。然后从结果中提取干净的链接并调用asynch下载。使用直接结果链接很可能无法正常工作,因为谷歌会在一些文件和#34;异常数据传输"之后阻止它。