Perl工具在通过WGET下载之前读取远程文件

时间:2012-07-10 16:19:01

标签: perl wget

假设网页中有文本文件链接。现在我可以使用HTML构建器来解析页面,提取该链接,并通过WGET将该文件下载到我选择的目录中。但是在下载文件之前是否可以对文件进行检查?我的意思是,比如检查前6个字母是否与序列cooler匹配,如果是,那么只下载它?

1 个答案:

答案 0 :(得分:4)

在下载文件之前,先阅读部分文件?

您可以使用curl及其--range选项下载部分文件。但是你需要足够了解该文件以跳过我认为的任何元/标题数据。

man curl

请注意,根据手册页:

  

你也应该意识到很多   HTTP / 1.1服务器没有启用此功能,所以当你   试图获得一个范围,你将获得整个文档。