如何在没有此字符串的双引号的情况下获取网址:
<p>The document has moved <a href="http://xxx/aaa/index.html">here</a>.</p>
答案 0 :(得分:0)
您可以使用正则表达式http:[^"]+
答案 1 :(得分:0)
假设html字符串位于名为“regexp.html”的文件中
$ ruby -n -e 'm = $_.match(/(http[^"]+)/); puts m if m' < regexp.html
http://xxx/aaa/index.html
仅当网址以“http”开头时才会生效。