xml.etree.ElementTree无法读取<img ...=""/>

时间:2018-02-24 10:44:47

标签: html xml python-3.x

我想用xml.etree.ElementTree解析下面的html片段 python 3的模块。

<html>
  <table>
    ...
    <td><img src="myimg.png" title="mytitle" alt="myalttext"></td>
    ...
  </table>
</html>

但由于img-tag导致“不匹配标记”解析错误,该标记以“&gt;”而不是“/&gt关闭;“即可。使用“/&gt;”关闭代码时不会发生错误。

但是,我正在从网站上加载那个html,所以我不能指望它们 用“/&gt;”关闭img-tag (此外,这似乎也是一种常见的方式 只需使用“&gt;”关闭它,请参阅W3Schools on images

你知道如何避免这种情况吗?我还想避免在将其传递给xml.etree.ElementTree解析器之前手动解析它。我还想避免使用其他解析器,除非它们已经可用 在默认的python库中。

0 个答案:

没有答案