错误的html标签

时间:2014-09-24 08:54:28

标签: python html

有没有一种简单的方法来纠正错误解释的html标签? 例如:我在html文件中有以下文本:

<div class=paragraph style=" padding:0.00pt 18.48pt 0.00pt 19.68pt; text-align:left;"><span class=font29 style=" line-height:10.56pt;">Here is some text. and here comes a <wrongly interpreted html-tag> how can the "<" and ">" be removed?</span></div>

如何提取和更正所有错误解释的html标签? 我想到了一个列表,我添加了所有&#34;更正&#34; HTML标签。但我不确定这是否有效......

感谢您的帮助! :)

1 个答案:

答案 0 :(得分:0)

您应该使用HTML entities。例如,<应该用HTML编写为&lt;(小于),>编写为&gt;(大于)。

您的字符串将如下所示:

<div><span>Here is some text. and here comes a &lt;wrongly interpreted html-tag&gt; how can the "&lt;" and "&gt;" be removed?</span></div>