Question

我一直没有成功找到答案，但是到目前为止还是空白。 Wget是否具有使用html文件的Title标记中的文本中的“关键字”下载特定html文件的功能？我以为“ --follow-tag”也许可以做到，但是Title标记未包含在Wget标记数据库中。是的，我知道我可以在下载后过滤掉文件，但不想使用该选项。谢谢

Answer 1

您可以尝试以下操作：

wget -q `grep -oP '(?<=<url>).*?(?=</url>)' test.html`

它将从<url></url>文件内部搜索test.html标记内的任何url并下载。

Wget：下载特定的HTML文件

1 个答案: