当有人在浏览器中键入网址以访问网页时,该网址使用哪个字符集?有标准吗?我可以认为UTF-8到处使用吗?接受哪些字符?
答案 0 :(得分:1)
网址可能只包含ASCII的子集,所有网址都是有效的ASCII。
International domain names必须Punycode编码。必须对路径或查询部分中的非ASCII字符进行编码,Percent-encoding是普遍认可的标准。
百分比编码仅获取原始字节,并将每个字节编码为%xx
。对于应该使用什么编码来确定字节表示,通常没有遵循标准。因此,基本上不可能假设在百分比编码表示中使用任何特定字符集。如果您正在创建这些链接,那么您可以在百分比编码之前完全控制使用过的字符集;如果你不是,那你大部分都不走运。虽然您很可能会遇到UTF-8,但这并不能保证。