用wget正则表达式?

时间:2010-07-31 02:18:43

标签: wget

我正在使用wget下载一些有用的网站:

wget -k -m -r -q -t 1 http://www.web.com/

但是我想用自己的选择替换一些不好的词(比如雅虎管道正则表达式)

2 个答案:

答案 0 :(得分:3)

如果您想要使用wget提取的页面中的单词正则表达式,则应通过sed管道输出。

例如:

wget -k -m -r -q -t 1 -O - http://www.web.com/ | sed 's/cat/dog/g' > output.html

使用-O -标志将输出写入stdout,使用-q标志使wget以安静模式运行。

没有shell atm来检查我的语法,但这应该让你走上正确的道路!

答案 1 :(得分:1)

您可以使用sed -i

find www.web.com -type f -exec sed -i 's/word1\|word2\|word3//ig' {} +

word1,word2,word3等是要删除的单词。