当我使用python的html5lib时,得到''expected-doctype-but-got-chars“错误?

时间:2013-07-09 03:17:54

标签: python html5lib

这是我的代码:

from html5lib import treebuilders, HTMLParser
parser = HTMLParser(tree=treebuilders.getTreeBuilder("lxml"))
parser.parse("hello world!")
print parser.errors

导致错误的原因是什么?

但是html5lib的文档使用了这个:

import html5lib
parser = html5lib.HTMLParser(tree=html5lib.getTreeBuilder("dom"))
minidom_document = parser.parse("<p>Hello World!")

2 个答案:

答案 0 :(得分:1)

HTMLParser.errors包含解析文档时的所有解析错误;默认情况下,html5lib应该优雅地处理所有解析错误(是的,文档确实包含生成解析错误的示例 - 目的是记录API,而不是显示良好的HTML用法!),因此除非您出于某种原因关注解析错误(除非你有充分的理由,不要),它的价值完全无关紧要。

答案 1 :(得分:0)

当我使用after代码成功时:

parser.parse("<!DOCTYPE html>hello world!")