我正在使用python脚本,我在其中使用HTML文件中的数据。我使用HTMLParser模块,使用自己的handle_endtag等,如here所述
处理异常时,我正在研究处理HTMLParser.HTMLParseError异常。然而,我无法进行解析器抛出异常的测试用例!两个问题:
解析器是否擅长解析任何处理异常的东西都没用?
有人可以编写一个测试输入,使解析器抛出异常吗? (我想看看它的样子!)
可怜,折磨,解析。
答案 0 :(得分:2)
HTMLParser.HTMLParseError是在损坏的标记上引发的,在某些情况下,它在解析时遇到错误。
from HTMLParser import HTMLParser
parser = HTMLParser()
parser.feed('<![..]>')