处理HTMLParser.HTMLParseError异常和测试用例

时间:2013-08-01 08:19:43

标签: python exception html-parsing

我正在使用python脚本,我在其中使用HTML文件中的数据。我使用HTMLParser模块,使用自己的handle_endtag等,如here所述

处理异常时,我正在研究处理HTMLParser.HTMLParseError异常。然而,我无法进行解析器抛出异常的测试用例!两个问题:

解析器是否擅长解析任何处理异常的东西都没用?

有人可以编写一个测试输入,使解析器抛出异常吗? (我想看看它的样子!)

可怜,折磨,解析。

1 个答案:

答案 0 :(得分:2)

HTMLParser.HTMLParseError是在损坏的标记上引发的,在某些情况下,它在解析时遇到错误。

from HTMLParser import HTMLParser

parser = HTMLParser()

parser.feed('<![..]>')