这是我的代码:
from html5lib import treebuilders, HTMLParser
parser = HTMLParser(tree=treebuilders.getTreeBuilder("lxml"))
parser.parse("hello world!")
print parser.errors
导致错误的原因是什么?
但是html5lib的文档使用了这个:
import html5lib
parser = html5lib.HTMLParser(tree=html5lib.getTreeBuilder("dom"))
minidom_document = parser.parse("<p>Hello World!")
答案 0 :(得分:1)
HTMLParser.errors
包含解析文档时的所有解析错误;默认情况下,html5lib应该优雅地处理所有解析错误(是的,文档确实包含生成解析错误的示例 - 目的是记录API,而不是显示良好的HTML用法!),因此除非您出于某种原因关注解析错误(除非你有充分的理由,不要),它的价值完全无关紧要。
答案 1 :(得分:0)
当我使用after代码成功时:
parser.parse("<!DOCTYPE html>hello world!")