Question

这是我的代码：

from html5lib import treebuilders, HTMLParser
parser = HTMLParser(tree=treebuilders.getTreeBuilder("lxml"))
parser.parse("hello world!")
print parser.errors

导致错误的原因是什么？

但是html5lib的文档使用了这个：

import html5lib
parser = html5lib.HTMLParser(tree=html5lib.getTreeBuilder("dom"))
minidom_document = parser.parse("<p>Hello World!")

Answer 1

HTMLParser.errors包含解析文档时的所有解析错误;默认情况下，html5lib应该优雅地处理所有解析错误（是的，文档确实包含生成解析错误的示例 - 目的是记录API，而不是显示良好的HTML用法！），因此除非您出于某种原因关注解析错误（除非你有充分的理由，不要），它的价值完全无关紧要。

Answer 2

当我使用after代码成功时：

parser.parse("<!DOCTYPE html>hello world!")

当我使用python的html5lib时，得到''expected-doctype-but-got-chars“错误？

2 个答案: