在Ruby中解析URL以获得没有“www”的子域或主域?

时间:2013-01-18 21:55:48

标签: ruby

如果我有一个网址:

http://www.example.com/page

我想将其解释为:

example.com

但是,如果我有:

http://blog.example.com/page

我想回来:

blog.example.com

这难吗?

2 个答案:

答案 0 :(得分:12)

使用Ruby的URI模块:

require 'uri'
URI.parse('http://www.example.com/page').host
=> "www.example.com"
URI.parse('http://blog.example.com/page').host
=> "blog.example.com"

在这两种情况下,URI都会提取整个主机名,因为从域中选择性地剥离主机是没有意义的。

您必须使用以下内容单独实现该逻辑:

%w[http://www.example.com/page http://blog.example.com/page].each do |u|
  puts URI.parse(u).host.sub(/^www\./, '')
end

哪个输出:

example.com
blog.example.com

答案 1 :(得分:0)

您可以使用URI class;例如:

require 'uri'
uri1 = URI.parse("http://www.example.com/page")
puts uri1.host.gsub(/www\./i, "") #This will print example.com
uri2 = URI.parse("http://blog.example.com/page")
puts uri2.host #This prints blog.example.com
对于gsub

"www"只会替换"",不区分大小写。