正则表达式从Palo Alto URL过滤日志中捕获TLD

时间:2019-08-16 21:24:25

标签: regex

我正在尝试从Palo Alto威胁日志中生成的URI中捕获TLD。 TLD可以是任何东西,但始终可以在以下常见语法之间的系统日志中找到:

beginning: **Miscellaneous="**  
end: **/"**

Examples:  
Miscellaneous="example1.com/"  
Miscellaneous="example2.gov.au/"  
Miscellaneous="example3.co.uk/" 

向正则表达式寻求帮助。

1 个答案:

答案 0 :(得分:2)

根据您使用的语言,您可以使用环视方法断言某些文本之前有一个句点,而后跟一个正斜杠。

/(?<=\.)[a-z0-9]+(?=\/")/

  • (?<=\.)是积极的回顾,可以确保我们从句点开始
  • [a-z0-9]+将匹配实际的TLD(.com,.net,.uk,.au等)
  • (?=\/")是一个积极的前瞻,将以正斜杠匹配,并且为了安全起见,将双引号字符匹配。

这就是您想要的,因为这就是top level domain actually is,例如.com.net.uk