元标记:拉丁文和非拉丁文字母网站的标题和描述

时间:2011-11-07 08:28:10

标签: html internationalization meta-tags multilingual phonetics

我(我相信)有一种独特的情况;有点谜题。继续这笔交易。

情况:我有一个语言网站,其中所有内容(内容,链接)都是基于非拉丁语的字符。 (西里尔字母)(UTF-8)

该网站旨在联系全球的俄语读/读人员。

问题是很多人(约70%)正在使用拉丁字母输入俄语搜索词。例如:“novaja mashina”,用英语表示什么都没有,但用俄语表示“新车”。

我的任务是构建主页的标题和Meta标签=描述,所以如果可能的话,我可以一石二鸟,意味着适应那些拥有并将使用西里尔语键盘的人在西里尔语中输入搜索词以及使用拉丁字母构建俄语单词并仍然可以找到我的网站的人。

我的解决方案,(我相信很差),只是在标题标签中依次堆叠拉丁语和西里尔语,并且与meta = description相同。

  • 这完全是一个坏主意吗?

如果不是

  • 搜索引擎机器人/抓取工具会忽略用英文写的俄语单词吗?
  • 如果我这样做,谷歌或其他搜索引擎会对排名产生混淆或负面影响。
  • 用英语写一个标题和meta descr是个好主意吗?
  • 谷歌会考虑标题太长并惩罚我吗? (西里尔语+拉丁语 - 俄语+ 3次相同的英语最终会有点长的标题)

有人可以分享更聪明/更好的解决方案吗?

提前谢谢!!!

1 个答案:

答案 0 :(得分:1)

实际上,<meta>代码具有lang属性,可以帮助搜索引擎:

  • 了解您有多语言页面
  • 分别正确地索引每种语言的元数据。

以下是lang属性的使用方法:

<html lang="ru">
  <head>
    <meta charset="UTF-8">
    <meta name="description" lang="ru" content="новая машина">
    <meta name="description" lang="ru-Latn-t-cyrl" content="novaya mashina">
    <meta http-equiv="Content-Language" content="ru, ru-Latn-t-cyrl"/>
  </head>
...
</html>

语言代码ru-Latn-t-cyrl表示content标记的值实际上是俄语,但是从西里尔语到拉丁语的音译。有关此语言代码约定的详细信息,请参阅BCP 47 Extension Tcontent的{​​{1}}值告诉浏览器您的网页包含俄语和俄语音译为拉丁语。

现在你的问题:

  
      
  • 搜索引擎机器人/抓取工具会忽略用英文写的俄语单词吗?
  •   

可能不是。它们仍会被编入索引,您的网页最终可能会显示在transliterated string的搜索结果中。

  
      
  • 如果我这样做,谷歌或其他搜索引擎会对排名产生混淆或负面影响。
  •   

我不能肯定地说,因为我不是真正的SEO专家,但这不太可能。

  
      
  • 用英语写一个标题和meta descr是个好主意吗?
  •   

这取决于。如果您希望该网站显示英文搜索。

  
      
  • 谷歌会考虑标题太长并惩罚我吗? (西里尔语+拉丁语 - 俄语+ 3次相同的英语最终会有点长的标题)
  •   

如果您的网站没有英语作为语言,那么拥有英文标题没有多大意义。如果这样做,则在用户将语言切换为英语时将页面标题更改为英语。而且我认为音译的标题太多而且也不好听。请查看更详细的http-equiv="Content-Language"代码。

最后,这里有一些来自W3C的关于在HTML中声明语言的internationalization best practices