应用错误收集

wget - 使用URL中的查询字符串双下载

时间：2013-12-28 19:28:15

标签： jquery double download special-characters wget

我必须使用wget使用递归选项（-r）下载网页中的所有文件。

此页面包含指向N个文件的N个直接链接（http://xxx.xxx.xxx.xxx/page/File_n.abc），但还包含其他N个“直接”链接（查询字符串）到theese文件（http://xxx.xxx.xxx.xxx/page/File_n.abc?cd=at）。

如何避免下载theese文件（与第一个相同）。

我尝试了-R *cd*选项，但wget删除下载后的文件。我注意到，使用选项-R *xyz*，只有当“xyz”位于“?”符号之前的链接部分时，程序才会下载任何包含“xyz”的文件。否则程序将下载该文件，将删除该文件。

wget 手册说：“请注意，查询字符串（以问号开头的网址末尾的字符串）（'？'）不作为接受/拒绝规则的文件名的一部分包含在内，即使它们实际上有助于为本地文件选择的名称。预计Wget的未来版本将提供允许匹配的选项反对查询字符串。“

有什么想法吗？

0 个答案:

没有答案

相关问题

如何在Perl中恢复下载？

在漂亮的URL中使用查询字符串进行Mod_Rewrite

wget拒绝仍然下载文件

WGet也下载其他目录的内容

使用wget从URL列表中仅抓取jpg

wget - 使用URL中的查询字符串双下载

处理URL和查询字符串

使用.htaccess清除查询字符串URL

使用wget从URL列表下载带文件名的文件

使用.htaccess中的查询字符串重定向URL

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？