用于URL的Grep页面源

时间:2012-05-24 01:48:01

标签: terminal grep

我在文档文档中有一个网页来源,有几行如下:

"rid" : 'http://web.site/urlhere',

如何使用Linux /终端来查看http://web.site/urlhere部分?

1 个答案:

答案 0 :(得分:1)

您可以将 -o 选项传递给grep,告诉它只显示匹配的模式。

grep -o http://web.site/urlhere somefile.txt

假设您正在寻找通用URL,您可以从这样的事情开始(并可能改进它):

grep -o "'http.*'" someFile.txt | sed "s/'//g"

这将在单引号后搜索文本 http ,并将包括该行中的所有字符,直到最后一个单引号。然后它会将结果(只有匹配的模式)传递给sed并删除单引号。

注意:如果您在网址后面有更多单引号,可能会遇到麻烦(但您的问题没有提及)......

由于您的问题非常具体,因此可能存在许多可能导致问题的其他输入条件,但上述情况应该是一个很好的起点。

有关grep的更多信息:http://unixhelp.ed.ac.uk/CGI/man-cgi?grep