我需要创建一个有效的正则表达式(最少量的回溯)来从某些日志中提取顶级域名。 URL可以是四种类型之一,因此我需要以下内容:
我有一个半工作的解决方案,但它错过了一些。
"[^"]*(\w+\.[a-z]+|\d+\.\d+\.\d+\.\d+)\/
有人有什么建议吗?
答案 0 :(得分:2)
试试这个正则表达式:
([a-zA-Z0-9]+\.[a-zA-Z]+|[0-9\.]+|[a-zA-Z0-9]+)(?=\/)
您可以在regex101.com进行测试:https://regex101.com/r/dK0bJ7/4
比赛1:website.com
第2场:10.10.10.10
第3场:myserver
第4场:website.ca