我想用xml.etree.ElementTree解析下面的html片段 python 3的模块。
<html>
<table>
...
<td><img src="myimg.png" title="mytitle" alt="myalttext"></td>
...
</table>
</html>
但由于img-tag导致“不匹配标记”解析错误,该标记以“&gt;”而不是“/&gt关闭;“即可。使用“/&gt;”关闭代码时不会发生错误。
但是,我正在从网站上加载那个html,所以我不能指望它们 用“/&gt;”关闭img-tag (此外,这似乎也是一种常见的方式 只需使用“&gt;”关闭它,请参阅W3Schools on images)
你知道如何避免这种情况吗?我还想避免在将其传递给xml.etree.ElementTree解析器之前手动解析它。我还想避免使用其他解析器,除非它们已经可用 在默认的python库中。