Grep / Find / Xargs:在文件夹中的两个字符串或Wget的结果之间进行搜索

时间:2012-07-25 20:14:31

标签: find grep wget xargs

我有一个装满html文件的文件夹。

1 个答案:

答案 0 :(得分:0)

用于将HTML中的文本抓取到文件中: 如果你的grep版本支持它,-o开关告诉它只打印该行的匹配部分。

考虑到这一点,2 grep次调用应该对你进行排序(前提是你只能识别你想要获取文本的行);像这样的东西:

grep -Rn "var topicName =" html/ | grep -o '"[^"]*"' > topicNames.dat

如果将“符号留在那里是不可接受的,你可以在第二次grep之后通过sed传递它:

grep -Rn "var topicName =" html/ | grep -o '"[^"]*"' | sed 's/"//g' > topicNames.dat