Question

我有一个看起来像的文件：

<a href="some-adress">some-txt</a>
<a href="some-adress">some-txt</a>
<a href="some-adress">some-txt</a>
...

我需要下载所有“some-adress”文件，我怎样才能使用bash做到这一点？

Answer 1

你为什么不用wget？它已经有了这个功能：

wget -i --force-html yourfile.html

Answer 2

以下是使用sed，xargs和wget组合的一种方法：

sed -n 's/.*<a href="\([^"]*\)">.*/\1/p' input-file | xargs wget

Answer 3

cut -f 2 -d '"' file-with-addresses.txt

cut包含在所有posix shell中。此命令将使用"作为分隔符拆分该行，并返回第二个“字段”。要使用wget下载Adam Rosenfield的方法很好。

cut -f 2 -d '"' file-with-addresses.txt | xargs wget