许多博客使用“标签”和“类别”的概念来向帖子添加元数据。这种信息的语义标记的最佳实践是什么,这样阅读博客文章的机器可以轻松识别标签?
目前,我将"tag"
添加到链接上的rel
属性,例如
<a rel="tag" class="tag" href="/tags.html#site-configuration">#site-configuration</a>
我想可以使用Dublin Core的html格式作为关键字:
<meta name = "DC.Subject"
content = "site-configuration">
并将其添加到页面标题中,或者元标记可以放入正文中吗?是一个或另一个更好,或一些完全不同的选择?
在为内容提供精确和标准化的定义方面是否有更好的策略?
如果我想对元数据如此挑剔,或者我应该使用XML文档类型,HTML5是一个合理的选择吗?
不同方法的优点和缺点是什么?
答案 0 :(得分:14)
第一步将在语义上正确地获取/使用纯HTML。对于(X)HTML5,您应使用切片内容元素section
,article
,aside
和nav
构建合适的大纲,并使用header
和footer
将元数据内容与主要内容分开;还要考虑内联级语义,如time
(发布日期),dfn
(定义),abbr
(缩写/首字母缩略词)等。并使用meta
- {规范中定义的{1}}和name
值。
第二步将使用未在规范中定义但在指定位置注册的元数据属性值(因此它们可以有效使用),如{{3} }和name
keywords for meta
elements。
第三步将使用语义,机器可读注释来增强标记。有rel
values for a
/area
/link
elements:
rel
和class
值)RDFa和Microdata类似(可扩展且相当复杂),而微格式更简单(但不那么具有表现力/可扩展性)。我在程序员面前写了three common ways to do this关于差异的文章,以及关于short answer的更详细的答案。
对于RDFa或Microdata,您的主要工作是找到能够描述/分类您的内容的词汇表/本体。这些词汇表可以由每个人创建(您甚至可以自己创建),但通常建议使用众所周知的/流行的词汇表,例如,以便搜索引擎可以使用您的注释(流行示例:differences between Microdata and RDFa )。
对于Microformats,您必须找到适合您需要的Microformat(Schema.org)。如果您的案例没有,您可以提出一个新的Microformat(但这需要一些时间,直到它被“接受”,如果有的话)。
如果我想对元数据如此挑剔,或者我应该使用XML文档类型,HTML5是一个合理的选择吗?
如果您需要/想要XML支持,您也可以使用XHTML5。如果您“仅”使用规范中定义的(X)HTML而没有其他XML模式/词汇表,那么如果您使用HTML(5)或XHTML(5),则从语义角度来看无关紧要。