我正在使用wget下载一些有用的网站:
wget -k -m -r -q -t 1 http://www.web.com/
但是我想用自己的选择替换一些不好的词(比如雅虎管道正则表达式)
答案 0 :(得分:3)
如果您想要使用wget
提取的页面中的单词正则表达式,则应通过sed
管道输出。
例如:
wget -k -m -r -q -t 1 -O - http://www.web.com/ | sed 's/cat/dog/g' > output.html
使用-O -
标志将输出写入stdout
,使用-q
标志使wget
以安静模式运行。
没有shell atm来检查我的语法,但这应该让你走上正确的道路!
答案 1 :(得分:1)
您可以使用sed -i
。
find www.web.com -type f -exec sed -i 's/word1\|word2\|word3//ig' {} +
word1,word2,word3等是要删除的单词。