我有一个网站(http://a-site.com),其中包含许多链接。如何使用wget抓取并grep这种类型的文件链接?
<a href="/user/333333/follow_user" class="btn" rel="nofollow">Follow</a>
我尝试了这个但是这个命令不会让我获得与nofollow的链接。
$ wget --no-verbose -r -l1 http://a-site.com 2>&1
答案 0 :(得分:2)
来自此处的信息:
http://skeena.net/kb/wget%20ignore%20robots.txt
尝试:
wget -erobots=off http://your.site.here