扫描并修复缺少的HTML标签

时间:2018-10-01 19:53:45

标签: python html regex

我正在尝试找到使用python从源HTML页面修复丢失的HTML的最佳方法。 以下代码为例

<table>
    <tr>
        <td>11</td>
        <td>12</td>
    </tr>

        <td>21</td>
        <td>22</td>
    </tr>
<table>

表的第二行丢失。

我已经考虑过手动将所有标签替换为be,然后将所有标签替换为..解决这个问题似乎不是非常有效的方法。

有没有更好的方法来解决它?

0 个答案:

没有答案