用于博客帖子标签和类别的HTML5语义标记

时间:2012-10-12 19:43:35

标签: xml html5 metadata schema.org

许多博客使用“标签”和“类别”的概念来向帖子添加元数据。这种信息的语义标记的最佳实践是什么,这样阅读博客文章的机器可以轻松识别标签?

目前,我将"tag"添加到链接上的rel属性,例如

<a rel="tag" class="tag" href="/tags.html#site-configuration">#site-configuration</a>

我想可以使用Dublin Core的html格式作为关键字:

<meta name = "DC.Subject"
          content = "site-configuration">

并将其添加到页面标题中,或者元标记可以放入正文中吗?是一个或另一个更好,或一些完全不同的选择?

在为内容提供精确和标准化的定义方面是否有更好的策略?

如果我想对元数据如此挑剔,或者我应该使用XML文档类型,HTML5是一个合理的选择吗?

不同方法的优点和缺点是什么?

1 个答案:

答案 0 :(得分:14)

第一步将在语义上正确地获取/使用纯HTML。对于(X)HTML5,您应使用切片内容元素sectionarticleasidenav构建合适的大纲,并使用headerfooter将元数据内容与主要内容分开;还要考虑内联级语义,如time(发布日期),dfn(定义),abbr(缩写/首字母缩略词)等。并使用meta - {规范中定义的{1}}和name值。

第二步将使用未在规范中定义但在指定位置注册的元数据属性值(因此它们可以有效使用),如{{3} }和name keywords for meta elements

第三步将使用语义,机器可读注释来增强标记。有rel values for a/area/link elements

  • 微格式(使用预定义的relclass值)
  • RDFa(使用属性和URI)
  • 微数据(使用属性和URI)

RDFa和Microdata类似(可扩展且相当复杂),而微格式更简单(但不那么具有表现力/可扩展性)。我在程序员面前写了three common ways to do this关于差异的文章,以及关于short answer的更详细的答案。

对于RDFa或Microdata,您的主要工作是找到能够描述/分类您的内容的词汇表/本体。这些词汇表可以由每个人创建(您甚至可以自己创建),但通常建议使用众所周知的/流行的词汇表,例如,以便搜索引擎可以使用您的注释(流行示例:differences between Microdata and RDFa )。

对于Microformats,您必须找到适合您需要的Microformat(Schema.org)。如果您的案例没有,您可以提出一个新的Microformat(但这需要一些时间,直到它被“接受”,如果有的话)。


  

如果我想对元数据如此挑剔,或者我应该使用XML文档类型,HTML5是一个合理的选择吗?

如果您需要/想要XML支持,您也可以使用XHTML5。如果您“仅”使用规范中定义的(X)HTML而没有其他XML模式/词汇表,那么如果您使用HTML(5)或XHTML(5),则从语义角度来看无关紧要。