我怎么能只用regexp得到双引号内的东西?

时间:2012-10-12 13:53:42

标签: regex shell

如何在没有此字符串的双引号的情况下获取网址:

<p>The document has moved <a href="http://xxx/aaa/index.html">here</a>.</p>

2 个答案:

答案 0 :(得分:0)

您可以使用正则表达式http:[^"]+

答案 1 :(得分:0)

假设html字符串位于名为“regexp.html”的文件中

$ ruby -n -e 'm = $_.match(/(http[^"]+)/); puts m if m' < regexp.html 
http://xxx/aaa/index.html

仅当网址以“http”开头时才会生效。