在网络应用程序中,有一个HTML页面,编码如下:
<meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
<meta content="en" http-equiv="Content-language">
<meta content="text/html; charset=UTF-8" http-equiv="Content-type">
实际发生的是这个页面我试图显示肥皂请求的结果。为了回应这个肥皂请求,我得到以下代码:
èéàùìçò
表示以下字符:
èéàùìçò
并且令人惊讶地在HTML页面上这些字符正确显示如下,页面编码为UTF-8:
èéàùìçò instead of �������
我无法理解这些代码如何以UTF-8格式正确转换,因为这些代码属于ISO-8859-15。任何想法?
答案 0 :(得分:2)
è
等字符引用具有基于Unicode字符数的含义,完全独立于页面的字符编码。这一直是HTML中的原则,只有非常早期的浏览器有时会出错。这是使用字符引用的主要好处之一。
Unicode中的前256个代码位置与ISO-8859-1代码位置相同,后者与ISO-8859-15代码位置相同,除了少数字符(不包括示例中的那些)。