从URL字符串获取付费级别域

时间:2017-04-15 20:09:19

标签: java url

如何从URL中提取薪资级域,是否有自动执行此操作的java库?

1 个答案:

答案 0 :(得分:1)

上次我检查时我没有找到任何lib,我最终使用了这个正则表达式:

private static final Pattern URL_PATTERN = Pattern.compile(
        "(?:^|[\\W])((ht|f)tp(s?):\\/\\/|www\\.)"
                + "(([\\w\\-]+\\.){1,}?([\\w\\-.~]+\\/?)*"
                + "[\\p{Alnum}.,%_=?&#\\-+()\\[\\]\\*$~@!:/{};']*)",
        Pattern.CASE_INSENSITIVE | Pattern.MULTILINE | Pattern.DOTALL);

Guava的InternetDomainName可能会被用来从单个元素中组合出来。

使用示例:

  

例如,对于域名mail.google.com,此方法返回列表["mail", "google", "com"]

ImmutableList<String> parts = InternetDomainName.from("mail.google.com").parts()