我正在尝试从Palo Alto威胁日志中生成的URI中捕获TLD。 TLD可以是任何东西,但始终可以在以下常见语法之间的系统日志中找到:
beginning: **Miscellaneous="**
end: **/"**
Examples:
Miscellaneous="example1.com/"
Miscellaneous="example2.gov.au/"
Miscellaneous="example3.co.uk/"
向正则表达式寻求帮助。
答案 0 :(得分:2)
根据您使用的语言,您可以使用环视方法断言某些文本之前有一个句点,而后跟一个正斜杠。
/(?<=\.)[a-z0-9]+(?=\/")/
(?<=\.)
是积极的回顾,可以确保我们从句点开始[a-z0-9]+
将匹配实际的TLD(.com,.net,.uk,.au等)(?=\/")
是一个积极的前瞻,将以正斜杠匹配,并且为了安全起见,将双引号字符匹配。这就是您想要的,因为这就是top level domain actually is,例如.com
,.net
,.uk
等