为什么根据使用的字符集有不同的HTML URL编码?

时间:2016-03-13 21:55:09

标签: html encoding url-encoding

我正在阅读W3Schools的HTML教程,特别是HTML URL Encoding部分 这里说:

  

只能使用ASCII字符集通过Internet发送URL。如果URL包含ASCII集之外的字符,则必须转换URL。

  

您的浏览器将根据页面中使用的字符集对输入进行编码。

例如(关于最后一点)字符在{-1}}中编码为Windows-1252,%80编码为UTF-8。

我的问题是:如果只能使用ASCII字符,为什么有两种方法可以根据所使用的字符集转换相同的字符?不可能只有一个?这样的收益是什么?在此之后,我为什么要使用%E2%82%AC属性?

1 个答案:

答案 0 :(得分:0)

它们只是不同的标准。

Microsoft Windows-1252 和其他 Windows - {$ ver}是在早期的计算机中创建的。 Windows-1252 字符长度为字节,表示它支持最大 255 个不同的符号

这是字节长字符的解决方案 一些旧网站仍在使用这些字符集。

相反, UTF-8 最多存储4个字节。这绰绰有余。

UTF-8因此是事实上的当前标准,能够存储所有Unicode字符。它取代了所有编码方言的窗口(如Windows-1252,Windows-1250,Windows-1251等)。

强烈建议使用UTF-8编码所有Web文件。