标签: html html5 html-parsing token tokenize
我正在学习HTML解析。在标记化阶段,字节流被标记化为标记。标准HTML标记化支持多少个标记类型?它是否包含开始标记令牌,评论标记?
评论是否会被视为令牌并附加到DOM树?
答案 0 :(得分:4)
The HTML specification says:
标记化步骤的输出是一系列零个或多个以下标记:DOCTYPE,开始标记,结束标记,注释,字符,文件结尾。
所以有六种不同的代币。
要回答您的上一个问题:评论是令牌,并且有DOM interface for them。