如何在HTML关键字中使用unicode字符?

时间:2011-12-23 01:49:49

标签: html unicode character meta-tags keyword

HTML文档的元部分可以包含关键字部分。

<!DOCTYPE html>
<html>
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
        <meta name="description" content="under construction" />
        <meta name="keywords"
          content="..." />

可以在本节中使用unicode字符(即\u00B0)吗?如果是的话怎么样?

2 个答案:

答案 0 :(得分:7)

您放入HTML文档的所有字符,无论是在属性值还是其他位置,都是Unicode字符。如果您的文档的字符编码是UTF-8,正如您的示例所声明的那样(但最好是UTF-8编码然后!),您可以直接在那里输入任何字符,例如度数符号(°)。如何执行此操作取决于您的创作环境。您也可以使用字符引用(like &#xb0;),或者对于某些字符,使用实体引用(like &deg;)。

但\ u00B0不是HTML表示法。它只是一个六个字符的序列。它在JavaScript中具有特殊含义,但在HTML中则没有。相应的HTML表示法为&#xb0;

搜索引擎可能会忽略特殊字符,例如关键字中的度数签名。但不一定;据观察,谷歌在某些特殊情况下对他们很敏感。 (目前不是为了学位标志,似乎。)

<meta name=description ...>标记中,如果搜索引擎在构建搜索结果列表的页面描述时使用其内容,则特殊字符可能是相关的。这种事情仍然会发生,尽管不像以前那么频繁。

答案 1 :(得分:2)

因为使用Unicode作为其正文内容的非英语网站也将使用Unicode作为其元数据,所以可以合理地假设处理HTML元数据的重要工具将能够以UTF-8处理此问题。

另请注意,(至少在历史上)keywords元标记旨在包含人们可能搜索的字词。您的示例\00B0是度数符号;在这种情况下,人们似乎更有可能搜索单词而不是符号°。由于广泛滥用关键字元数据,许多搜索引擎(包括Google)会忽略它们进行搜索排名。

因此,总而言之,我认为使用Unicode关键字元数据是安全的。但它可能无法提高您网站对这些字词的搜索排名