双重编码的HTML代码

时间:2012-06-01 23:09:53

标签: python postgresql wysiwyg html-content-extraction

我使用xinha作为html-content的WYSIWYG编辑器。 我通过post-form将html文章发送到postgresql。 到目前为止一切顺利,他们似乎没问题。 但是当我从pg接收并输出到html页面时,我看到双重编码,即破坏的html代码 像这样

<p><a href="http://google.com">google.com</a></p>   <p> </p>   <p>

关于在哪里搜索问题的任何想法? 提前致谢

1 个答案:

答案 0 :(得分:2)

import HTMLParser
hp=HTMLParser.HTMLParser()
s="<p><a href="http://google.com">google.com</a></p>   <p> </p>   <p>"
print hp.unescape(s)

# u'<p><a href="http://google.com">google.com</a></p>   <p> </p>   <p>'