html5 charset = utf-8不适用于德语变音符号

时间:2013-05-15 22:17:29

标签: html5 utf-8 character-encoding

我想在我的新页面中显示,html是版本5,我将元字符集设置为

<meta http-equiv="content-type" content="text/html; charset=UTF-8">

但仍显示此形状的€

我应该怎么做以便德国字符被正确编码?

3 个答案:

答案 0 :(得分:3)

将元标记设置为“charset = UTF-8”实际上并没有做太多用处(与流行的智慧相反)。

使用文本编辑器,您需要使用UTF-8字符编码保存文件。例如,在Windows记事本中,您可以在“另存为”选项下找到编码选项。

答案 1 :(得分:3)

当程序将其数据解释为UTF-8时,程序显示“в,¬”,则数据由字节D0 B2 E2 80 9A C2 AC组成。这听起来像是数据全部混乱,可能是由于错误的字符代码转换。

另一方面,由于你说仍然显示这一点,meta标签可能无效,因为它被HTTP标头覆盖(只有在页面的URL可用时才能确定。)

首先应该找出页面的实际字符编码。您可能需要追溯其起源。然后将其转换为UTF-8(可能在编辑器中打开它,可以识别其当前编码,然后将其保存为带有BOM的UTF-8),前提是服务器未声明其他编码。

答案 2 :(得分:0)

以utf-8编码的'€'字符是0xE2,0x82,0xAC,这是二进制

E2:11100010
82:10000010个
AC:10101100

剥离1110的startbyte,以下10个字节,这将成为以下“有效负载位”:10000010101100

这是十进制的8364,必须是欧元字符的unicode代码点。

不知何故,您的查看器不会解码代码点以便从字体中获取字形,它会将三字节序列的每个字节显示为单个字符。这意味着您的视图不是真正意识到的。在http-header或browser中设置编码。浏览器可能不会在html页面的元标记中挖掘编码集。