我试图编写一个Java RegEx,它将从域,子域和多子域列表中提取域名。
我写的RegEx有太多的域需要维护,而且还有更多的域。 https://publicsuffix.org/list/effective_tld_names.dat
捕获域名的更好方法是什么?目标是删除子域名,提取域名,以便我可以解析或ping它。
这是我提出的RegEx
(\w*.(?:\.co|\.org|\.net|\.int|\.edu|\.gov|\.mil|\.arpa|\.tv|\.aero|\.asia).*)
以下是我正在测试的示例列表。
comnettest.google.com
doubleclick.net
googleapis.com
imrworldwide.com
bom.gov.au
www.bom.gov.au
googleapis.com
www.google.com
www.twiiter.com
dynamic.t2.tiles.virtualearth.net
domain.com
1-A.domain.com
1-A.2-B.domain.com
1-A.2-B.3-C.domain.com
mt0.google.com
twitch.tv
stream.twitch.tv
streamcom.com.au
network.google.com