问题与++和iso-8859-1

时间:2015-06-18 11:42:32

标签: windows character-encoding notepad++

我需要制作两个HTML文件,并使用notepad +++来完成它。 这两个文件必须用Latin-1 A.K.A iso-8859-1编码。

当我选择该选项时。 notepad ++在屏幕右下角显示iso 8859-1。但记事本++不考虑,我需要保存AND

当我关闭标签并重新加载文件时,右下角会显示“ANSI”。

我该怎么办?

1 个答案:

答案 0 :(得分:0)

许多字符集都有共同的字符。这些字符集的编码通常编码具有相同字节的公共字符。

如果文件中的所有字符都在ISO 8859-1中,并且无论哪个ANSI字符集是默认设置,则保存为任一编码都可以生成具有相同字节的文件。如果是这样,这是一个你应该忽略的巧合。

很高兴您明确要求编码。如果不知道编码,两个人/系统就无法明确地交换文本。但是,很少有系统可以用文本文件实际保存这个“元数据”。大多数依赖于用户或操作系统的默认编码。像Notepad ++这样的许多程序会计算出文件对哪些编码有效,并且当它是其中一个候选者时会选择默认值。

这就是HTML或XML等文档规范(旨在在系统之间传递)允许在文本中指定编码的原因。读取文件的程序可以猜测编码,直到它能够很好地读取文件以查看指定的文件。

要判断在您的情况下是否无关紧要,请保存两份:一份为ISO 8859-1,另一份为ANSI编码。然后打开命令提示符并运行fc /b latin.htm ansi.htm。它可能会打印FC: no differences encountered。再次,这是巧合。当询问带有ISO 8859-1编码的文本时,请将其保存为这样,并说明它是您交付时的样子。

为清楚起见,您可以在文本中指定编码。按照HTML文档的标准执行:HTML 4.01或HTML 5.