使用wget使用rel =“nofollow”抓取链接

时间:2014-11-27 20:39:12

标签: bash grep wget

我有一个网站(http://a-site.com),其中包含许多链接。如何使用wget抓取并grep这种类型的文件链接?

<a href="/user/333333/follow_user" class="btn" rel="nofollow">Follow</a>

我尝试了这个但是这个命令不会让我获得与nofollow的链接。

$ wget --no-verbose -r -l1 http://a-site.com 2>&1

1 个答案:

答案 0 :(得分:2)

来自此处的信息:

http://skeena.net/kb/wget%20ignore%20robots.txt

尝试:

wget -erobots=off http://your.site.here