在Go中验证国际域名的最佳方法

时间:2018-07-25 09:53:56

标签: go

在Go中验证国际域名的最佳方法是什么?

https://golang.org/pkg/net/?m=all#isDomainName

https://golang.org/src/net/dnsclient.go?s=3444:3476#L109

也许正在复制不是从网络软件包中导出的此功能?

我们需要验证icaan.org和example等域。(特殊字符)

编辑:IDN https://en.wikipedia.org/wiki/Internationalized_domain_name

已经使用govalidator验证了IDN,因为它无法处理Unicode字符https://github.com/asaskevich/govalidator/blob/master/validator.go

以下是IDN的一些示例

刚刚看到了对punycode的引用。

尽管所有这些punycode都在公共后缀列表https://publicsuffix.org/list/public_suffix_list.dat

:(

1 个答案:

答案 0 :(得分:0)

一种可能的方法是使用内置函数url.Parse(string)url.Hostname()以及正则表达式来匹配由点分隔的Unicode字母/数字/标记的序列(如示例数据集所示)

例如:

var domainNamePattern = regexp.MustCompile(`^([\p{L}\p{M}\p{N}_%+-]+\.)+[\p{L}\p{M}\p{N}]+$`)

func main() {
  ss := []string{
    `https://evertpot.com/internationalized-domain-names-are-you-ready/`,
    `http://bogus!.com`,
    `https://foo1.bar2.com.gah.zip/`,
    `http://مثال.إختبار`,
    `http://例子.测试`,
    `http://例子.測試`,
    `http://παράδειγμα.δοκιμή`,
    `http://उदाहरण.परीक्षा`,
    `http://例え.テスト`,
    `http://실례.테스트`,
    `http://مثال.آزمایشی`,
    `http://пример.испытание`,
  }

  for _, s := range ss {
    u, err := url.Parse(s)
    if err != nil || !domainNamePattern.MatchString(u.Hostname()) {
      bogusPart := s
      if err == nil {
        bogusPart = u.Hostname()
      }
      fmt.Printf("ERROR: invalid URL or hostname %q\n", bogusPart)
      continue
    }
    fmt.Printf("OK: hostname=%q\n", u.Hostname())
  }
}

// OK: hostname="evertpot.com"
// ERROR: invalid URL or hostname "bogus!.com"
// OK: hostname="foo1.bar2.com.gah.zip"
// OK: hostname="مثال.إختبار"
// OK: hostname="例子.测试"
// OK: hostname="例子.測試"
// OK: hostname="παράδειγμα.δοκιμή"
// OK: hostname="उदाहरण.परीक्षा"
// OK: hostname="例え.テスト"
// OK: hostname="실례.테스트"
// OK: hostname="مثال.آزمایشی"
// OK: hostname="пример.испытание"

当然,应该更加谨慎地构建正则表达式,使其符合任何相关规范,但是此示例应该是一个很好的起点。