桌上td的Python美丽的汤标记

时间:2010-07-20 12:50:05

标签: python beautifulsoup

表td的Python美丽汤标记

  <td class="result" valign="top" colspan="3">

目前,以下情况不起作用:

for header in soup('table', 'td .result'):

获取错误:

HTMLParser.HTMLParseError: malformed start tag

1 个答案:

答案 0 :(得分:1)

website所述,HTMLParser为quite fragile。您应该使用SGMLParser,因为它对格式错误的HTML更强大。

不幸的是,Python 3.0已从标准库中删除了SGMLParser。请参阅上面的链接,了解建议的解决方法,例如使用html5lib