在Go中验证国际域名的最佳方法是什么?
https://golang.org/pkg/net/?m=all#isDomainName
https://golang.org/src/net/dnsclient.go?s=3444:3476#L109
也许正在复制不是从网络软件包中导出的此功能?
我们需要验证icaan.org和example等域。(特殊字符)
编辑:IDN https://en.wikipedia.org/wiki/Internationalized_domain_name
已经使用govalidator验证了IDN,因为它无法处理Unicode字符https://github.com/asaskevich/govalidator/blob/master/validator.go
以下是IDN的一些示例
刚刚看到了对punycode的引用。
尽管所有这些punycode都在公共后缀列表https://publicsuffix.org/list/public_suffix_list.dat
中:(
答案 0 :(得分:0)
一种可能的方法是使用内置函数url.Parse(string)
和url.Hostname()
以及正则表达式来匹配由点分隔的Unicode字母/数字/标记的序列(如示例数据集所示)
例如:
var domainNamePattern = regexp.MustCompile(`^([\p{L}\p{M}\p{N}_%+-]+\.)+[\p{L}\p{M}\p{N}]+$`)
func main() {
ss := []string{
`https://evertpot.com/internationalized-domain-names-are-you-ready/`,
`http://bogus!.com`,
`https://foo1.bar2.com.gah.zip/`,
`http://مثال.إختبار`,
`http://例子.测试`,
`http://例子.測試`,
`http://παράδειγμα.δοκιμή`,
`http://उदाहरण.परीक्षा`,
`http://例え.テスト`,
`http://실례.테스트`,
`http://مثال.آزمایشی`,
`http://пример.испытание`,
}
for _, s := range ss {
u, err := url.Parse(s)
if err != nil || !domainNamePattern.MatchString(u.Hostname()) {
bogusPart := s
if err == nil {
bogusPart = u.Hostname()
}
fmt.Printf("ERROR: invalid URL or hostname %q\n", bogusPart)
continue
}
fmt.Printf("OK: hostname=%q\n", u.Hostname())
}
}
// OK: hostname="evertpot.com"
// ERROR: invalid URL or hostname "bogus!.com"
// OK: hostname="foo1.bar2.com.gah.zip"
// OK: hostname="مثال.إختبار"
// OK: hostname="例子.测试"
// OK: hostname="例子.測試"
// OK: hostname="παράδειγμα.δοκιμή"
// OK: hostname="उदाहरण.परीक्षा"
// OK: hostname="例え.テスト"
// OK: hostname="실례.테스트"
// OK: hostname="مثال.آزمایشی"
// OK: hostname="пример.испытание"
当然,应该更加谨慎地构建正则表达式,使其符合任何相关规范,但是此示例应该是一个很好的起点。