假设网页中有文本文件链接。现在我可以使用HTML构建器来解析页面,提取该链接,并通过WGET将该文件下载到我选择的目录中。但是在下载文件之前是否可以对文件进行检查?我的意思是,比如检查前6个字母是否与序列cooler
匹配,如果是,那么只下载它?
答案 0 :(得分:4)
在下载文件之前,先阅读部分文件?
您可以使用curl及其--range选项下载部分文件。但是你需要足够了解该文件以跳过我认为的任何元/标题数据。
man curl
请注意,根据手册页:
你也应该意识到很多 HTTP / 1.1服务器没有启用此功能,所以当你 试图获得一个范围,你将获得整个文档。