正则表达式删除红宝石中网址的网页部分

时间:2010-09-30 10:23:54

标签: ruby regex

我正在尝试删除网址的网页部分

例如,

www.example.com/home/index.html 

www.example.com/home 

任何帮助表示赞赏 感谢

3 个答案:

答案 0 :(得分:9)

在可能的情况下不使用正则表达式可能是个好主意。 You may summon Cthulhu。请尝试使用属于标准库的URI库。

require "uri"
result = URI.parse("http://www.example.com/home/index.html")
result.host # => www.example.com
result.path # => "/home/index.html"
# The following line is rather unorthodox - is there a better solution?
File.dirname(result.path) # => "/home"
result.host + File.dirname(result.path) # => "www.example.com/home"

答案 1 :(得分:0)

irb(main):001:0> url="www.example.com/home/index.html"
=> "www.example.com/home/index.html"
irb(main):002:0> url.split("/")[0..-2].join("/")
=> "www.example.com/home"

答案 2 :(得分:0)

如果您的心脏开始使用正则表达式并且您知道您的网址非常直接,那么您可以使用(.*)/.*来捕获网址中最后一个/之前的所有内容。

irb(main):007:0> url = "www.example.com/home/index.html"
=> "www.example.com/home/index.html"
irb(main):008:0> regex = "(.*)/.*"
=> "(.*)/.*"
irb(main):009:0> url =~ /#{regex}/
=> 0
irb(main):010:0> $1
=> "www.example.com/home"