我正在阅读W3Schools的HTML教程,特别是HTML URL Encoding部分 这里说:
只能使用ASCII字符集通过Internet发送URL。如果URL包含ASCII集之外的字符,则必须转换URL。
和
您的浏览器将根据页面中使用的字符集对输入进行编码。
例如(关于最后一点)字符€
在{-1}}中编码为Windows-1252,%80
编码为UTF-8。
我的问题是:如果只能使用ASCII字符,为什么有两种方法可以根据所使用的字符集转换相同的字符?不可能只有一个?这样的收益是什么?在此之后,我为什么要使用%E2%82%AC
属性?
答案 0 :(得分:0)
它们只是不同的标准。
Microsoft Windows-1252 和其他 Windows - {$ ver}是在早期的计算机中创建的。 Windows-1252 字符长度为字节,表示它支持最大 255 个不同的符号
这是字节长字符的解决方案 一些旧网站仍在使用这些字符集。
相反, UTF-8 最多存储4个字节。这绰绰有余。
UTF-8因此是事实上的当前标准,能够存储所有Unicode字符。它取代了所有编码方言的窗口(如Windows-1252,Windows-1250,Windows-1251等)。
强烈建议使用UTF-8编码所有Web文件。