Question

我有一个包含中文文本的HTML文件。当我在任何Web浏览器中打开文件时，有些字符似乎缺失。

这是从浏览器窗口复制的示例：

本函旨在邀请您参��定于

我知道这里看到的所有其他角色除了缺失的角色外都是正确的（由中国本土人士确认）。

在HTML标题中，我有一个标记，表示该文件包含UTF-8编码字符：

<META http-equiv="Content-Type" content="text/html; charset=utf-8">

我已经在这个META标签中尝试了其他一些字符集，但到目前为止，似乎我尝试使用UTF-8的任何编码方法最终看起来更糟。

我还考虑过它是字体问题的可能性，所以我在我的系统上安装了3种不同的繁体中文字体，并迫使Chrome使用它们。他们都没有任何区别 - 缺少的角色仍然存在。

如果我用Notepad ++打开HTML文件，我可以看到：

如果我选择并将此文本复制粘贴到常规MS记事本中，我会得到：

本函旨在邀请您参劦NBSP;定于

所以你可以在这里看到＆＃34; xE5 x8A＆＃34; Notepad ++中可见的内容似乎已被替换为劦。

在这种情况下，浏览器是否有任何理由显示��而不是？？

Answer 1

再看一下HTML文件。

我看到以UTF-8编码的字符的前2个字节，然后是...让我们想象最初有一个\ xA0，当通过应用全局创建文件时，这被突变为 替换为UTF-8编码的数据。

然而，\ xE5 \ x8A \ xA0 UTF-8解码为U + 52A 0 ，这与U + 52A 6 的外星人字符不同。 ..不够接近答案。