标签: python beautifulsoup
表td的Python美丽汤标记
<td class="result" valign="top" colspan="3">
目前,以下情况不起作用:
for header in soup('table', 'td .result'):
获取错误:
HTMLParser.HTMLParseError: malformed start tag
答案 0 :(得分:1)
如website所述,HTMLParser为quite fragile。您应该使用SGMLParser,因为它对格式错误的HTML更强大。
不幸的是,Python 3.0已从标准库中删除了SGMLParser。请参阅上面的链接,了解建议的解决方法,例如使用html5lib。