获取正则表达式中URL的顶级和二级域

时间:2013-11-06 12:04:56

标签: regex apache-pig

我正在尝试使用正则表达式返回URL的结尾。例如: google.com应该返回com google.co.uk应该返回co.uk

我可以使用此正则表达式提取google.com:[^。] +(?=。$ | $) 正则表达式是否可以实际考虑到co.uk而不仅仅是返回最后一个值? 我研究了http://gskinner.com/RegExr/,但它似乎没有任何帮助,因此我的问题

我想在猪身上做这件事。

提前致谢

1 个答案:

答案 0 :(得分:0)

这是一个解决方案:

(?:\.)([^\.]{1,3}\.?[^\.]*)$

JavaScript中的示例(您没有精确的语言):

"google.co.uk".match(/(?:\.)([^\.]{1,3}\.?[^\.]*)$/).pop() => "co.uk"
"google.com".match(/(?:\.)([^\.]{1,3}\.?[^\.]*)$/).pop() => "com"
"a.google.com".match(/(?:\.)([^\.]{1,3}\.?[^\.]*)$/).pop() => "com"