搜索引擎将如何对不同的unicode做出反应?

时间:2013-04-20 19:44:42

标签: unicode character-encoding fonts seo search-engine

我正在开发一个格鲁吉亚语的网站。格鲁吉亚字母有自己的Unicode范围,但也有特殊的字体,格式字形代替英文字符,有点像“符号”和“装饰”字体。

例如,字符串“saqarTvelo”将使用这些字体呈现为“საქართველო”。所以现在我有两个选择,不知道该怎么做:

  1. 在我的网站上使用格鲁吉亚语Unicode,但问题是所有字体都是为英文Unicode创建的,并且不适用于格鲁吉亚语。

  2. 使用带有英文Unicode的格鲁吉亚字体。但我不知道搜索引擎会如何反应。

  3. 请告诉我该怎么做,我已经堆叠了!

1 个答案:

答案 0 :(得分:2)

简短的回答是,使用选项1中的方法,搜索引擎会在文本中看到“საქართველო”这个词为“saqarTvelo”,因此普通搜索会失败。

问题似乎是指在网页上使用格鲁吉亚字母的两种不同方式:

  1. 使用Unicode编码,以便使用Unicode编码的字体呈现字符(这是大多数字体,但大多数字体不包含格鲁吉亚字母)。
  2. 使用非标准的“私有”编码,通常将256个不同的代码位置(8位组合)映射到某些目的所需的任何字符。这假定使用以相同方式编码的字体呈现文本。
  3. 方法2可以被描述为wrong approach,但是从早期开始就已经在网上使用过(即使CSS不可用而且必须求助于<font face=...>来设置字体) ,尤其是在早期。除非用户的计算机具有特定的“私密”编码字体(或某些字体以完全相同的方式编码),否则它确实无效。由于搜索引擎与字体无关,因此它们只能看到8位代码,并尝试在页面声明或隐含的编码中解释它们,而不是“私有”编码(由于没有已发布的定义而无法声明)没有标准名称或任何名称)。

    方法1存在的问题是,为了使其工作,用户的计算机需要具有支持所使用字符的某些(Unicode编码字体)。如今,通过@font-face使用可下载的字体(网络字体)可以很好地解决这个问题。 Fonts that support Georgian letters包括一些有用的免费字体,如DejaVu字体,GNU Freefont字体和Quivira。有关此方法的详细信息,请参阅我的Guide to using special characters in HTML

    使用方法1,搜索引擎将正确查看格鲁吉亚字母,前提是文档的编码(通常为UTF-8)已正确声明或可由搜索引擎推断。