RegEx - 从多个子域中提取域名

时间:2014-10-03 06:45:52

标签: regex

我试图编写一个Java RegEx,它将从域,子域和多子域列表中提取域名。

我写的RegEx有太多的域需要维护,而且还有更多的域。 https://publicsuffix.org/list/effective_tld_names.dat

捕获域名的更好方法是什么?目标是删除子域名,提取域名,以便我可以解析或ping它。

这是我提出的RegEx

(\w*.(?:\.co|\.org|\.net|\.int|\.edu|\.gov|\.mil|\.arpa|\.tv|\.aero|\.asia).*)

以下是我正在测试的示例列表。

comnettest.google.com
doubleclick.net
googleapis.com
imrworldwide.com
bom.gov.au
www.bom.gov.au
googleapis.com
www.google.com
www.twiiter.com
dynamic.t2.tiles.virtualearth.net 
domain.com
1-A.domain.com
1-A.2-B.domain.com
1-A.2-B.3-C.domain.com
mt0.google.com
twitch.tv
stream.twitch.tv
streamcom.com.au
network.google.com

0 个答案:

没有答案