如何修复字符编码?

时间:2014-10-07 14:07:05

标签: html unicode character-encoding char special-characters

我已经下载了一组网页,希望能够在本地访问这些网页(他们的在线版本已被删除)。

将它们加载到chrome / Firefox中,我遇到了大量未知字符,如下所示:

Image which shows many special chars displayed as a diamond with a question mark inside.

HTML在Notepad ++中加载如下:

Image showing character encoding as xE9 and xF1 and similar.

图像只显示导致问题的一个字符,但无论何时使用重音字符或任何特殊字符,它都是相同的。

如何修复此问题并在浏览器中正确渲染?

2 个答案:

答案 0 :(得分:1)

只需在浏览器的“视图”→“编码”菜单中选择其他编码即可。

黑色钻石特别表明浏览器正试图将该页面解释为Unicode(可能特别是UTF-8),这显然不是正确的编码。尝试使用Latin-1,这可能是正确的。

答案 1 :(得分:0)

编辑文件并插入标记

<meta charset=windows-1252>

进入head部分。问题显然是页面是windows-1252编码但被视为utf-8编码。它也可能是其他一些8位编码,因此您可能需要尝试不同的编码。

当然,它可能更复杂,但没有足够的数据来决定这一点。