正则表达式从文本中提取二级域名

时间:2015-03-11 20:35:03

标签: regex pcre

我的splunk日志包含以下数据:

TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT TEXT , URL: http://www.rexegg.com/regex-boundaries.html, TEXT TEXT TEXT TEXT

我想只拔出" rexegg.com"但我现在得到了#34; www.rexegg"

最近我得到了:(?i)(?:http:\/\/|https:\/\/)(?P<test>(?<!,)\w*\.\w*)

1 个答案:

答案 0 :(得分:1)

将正则表达式更改为:

(?i)https?:\/\/(?:[^. ]+\.)*(?P<test>[\w-]+\.[\w-]+)

RegEx Demo