我一直没有成功找到答案,但是到目前为止还是空白。 Wget是否具有使用html文件的Title标记中的文本中的“关键字”下载特定html文件的功能?我以为“ --follow-tag”也许可以做到,但是Title标记未包含在Wget标记数据库中。是的,我知道我可以在下载后过滤掉文件,但不想使用该选项。 谢谢
答案 0 :(得分:0)
您可以尝试以下操作:
wget -q `grep -oP '(?<=<url>).*?(?=</url>)' test.html`
它将从<url></url>
文件内部搜索test.html
标记内的任何url并下载。