如何从URL中提取薪资级域,是否有自动执行此操作的java库?
答案 0 :(得分:1)
上次我检查时我没有找到任何lib,我最终使用了这个正则表达式:
private static final Pattern URL_PATTERN = Pattern.compile(
"(?:^|[\\W])((ht|f)tp(s?):\\/\\/|www\\.)"
+ "(([\\w\\-]+\\.){1,}?([\\w\\-.~]+\\/?)*"
+ "[\\p{Alnum}.,%_=?&#\\-+()\\[\\]\\*$~@!:/{};']*)",
Pattern.CASE_INSENSITIVE | Pattern.MULTILINE | Pattern.DOTALL);
Guava的InternetDomainName可能会被用来从单个元素中组合出来。
使用示例:
例如,对于域名
mail.google.com
,此方法返回列表["mail", "google", "com"]
ImmutableList<String> parts = InternetDomainName.from("mail.google.com").parts()