Python html2text文本问题

时间:2015-03-02 08:02:18

标签: python python-2.7

我使用html2text将Html转换为文本, 但它也改变了我的文本字符串,例如A&PA&P;

我怎样才能避免这种变化

In [1]: import html2text

In [2]: conv = html2text.HTML2Text()

In [3]: conv.handle("string A&P string")
P
&P;
Out[3]: u'string A&P; string\n\n'

输出应该是

Out[3]: u'string A&P string\n\n'

1 个答案:

答案 0 :(得分:0)

这是因为您转换的字符串有语法错误。 &安培;应该用html语言进行转义。

尝试

out = conv.handle("string A&P string")