HTML - charset windows 1255可以工作,但是utf-8

时间:2013-12-07 19:00:48

标签: html utf-8 windows-1255

我写了html页面,显示混合的希伯来语/英语内容。它与charset“windows - 1255”一起工作正常

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN""http://www.w3.org/TR/html4/loose.dtd">
<html dir="rtl" lang="he">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1255">

,但我认为如果他们的机器不支持希伯来语,人们会遇到麻烦。我将charset改为utf-8并得到了

HTML:

 meta http-equiv="Content-Type" content="text/html; charset=utf-8"

查看:

"��� ��� ������, ��� ����� �����, �� ������ ���� ��� ���� �� ������"
Read zohar ��� ����
....

是不是utf-8假设支持更多的字符然后是Windows 1255?

2 个答案:

答案 0 :(得分:7)

我想当你更改标签时,你没有告诉你的编辑器将文件转换为UTF-8。因此,该文件仍然是Windows-1255格式,但浏览器尝试将其读取为UTF-8,因此您会收到错误/不可读的字符。

我不知道您正在使用哪种编辑器,所以我无法告诉您如何将其置于UTF-8模式。尝试在选项中找到有关要使用的字符集的设置。或者,在Windows记事本中打开文件,保存时,请确保从保存按钮旁边的下拉框中选择“代码页:UTF-8”。

答案 1 :(得分:-2)

  

与Unicode的关系

     

Unicode希伯来语块(U + 0590-U + 05FF)遵循Windows-1255,通过在与Windows-1255相同的相对位置编码字母和元音点。 Unicode在较低位置编码cantillation标记方面更进一步。 Unicode希伯来语总是按逻辑顺序排列。

     

对于现代应用,UTF-8或UTF-16是首选编码。

来源:http://en.wikipedia.org/wiki/Windows_1255

在我看来,如果您的字符在Unicode希伯来语块中,您的编码仍然有用。