HTML5标记化有多少个标记类型?

时间:2012-08-15 17:49:31

标签: html html5 html-parsing token tokenize

我正在学习HTML解析。在标记化阶段,字节流被标记化为标记。标准HTML标记化支持多少个标记类型?它是否包含开始标记令牌,评论标记?

评论是否会被视为令牌并附加到DOM树?

1 个答案:

答案 0 :(得分:4)

The HTML specification says:

  

标记化步骤的输出是一系列零个或多个以下标记:DOCTYPE,开始标记,结束标记,注释,字符,文件结尾。

所以有六种不同的代币。

要回答您的上一个问题:评论是令牌,并且有DOM interface for them