我正在尝试找到使用python从源HTML页面修复丢失的HTML的最佳方法。 以下代码为例
<table>
<tr>
<td>11</td>
<td>12</td>
</tr>
<td>21</td>
<td>22</td>
</tr>
<table>
表的第二行丢失。
我已经考虑过手动将所有标签替换为be,然后将所有标签替换为..解决这个问题似乎不是非常有效的方法。
有没有更好的方法来解决它?