我有一个看起来像的文件:
<a href="some-adress">some-txt</a>
<a href="some-adress">some-txt</a>
<a href="some-adress">some-txt</a>
...
我需要下载所有“some-adress”文件,我怎样才能使用bash做到这一点?
答案 0 :(得分:3)
你为什么不用wget?它已经有了这个功能:
wget -i --force-html yourfile.html
答案 1 :(得分:2)
以下是使用sed
,xargs
和wget
组合的一种方法:
sed -n 's/.*<a href="\([^"]*\)">.*/\1/p' input-file | xargs wget
答案 2 :(得分:0)
cut -f 2 -d '"' file-with-addresses.txt
cut
包含在所有posix shell中。此命令将使用"
作为分隔符拆分该行,并返回第二个“字段”。要使用wget下载Adam Rosenfield的方法很好。
cut -f 2 -d '"' file-with-addresses.txt | xargs wget