答案 0 :(得分:2)
您需要遵循IDNA惯例:
为了防止包含连字符的非国际域名被意外解释为Punycode,国际域名Punycode序列有一个所谓的ASCII兼容编码(ACE)前缀,“xn--”,前置。[2]因此,域名“bücher.tld”将在ASCII中表示为“xn - bcher-kva.tld”。
使用python,您可以尝试encode('idna')
查找要使用的字符,例如:
$ python
>>> x = u'bücher.tld'
>>> x.encode('idna')
b'xn--bcher-kva.tld'
>>> x.encode('idna').decode('idna')
'bücher.tld'