我使用html2text
将Html转换为文本,
但它也改变了我的文本字符串,例如A&P
到A&P;
我怎样才能避免这种变化
In [1]: import html2text
In [2]: conv = html2text.HTML2Text()
In [3]: conv.handle("string A&P string")
P
&P;
Out[3]: u'string A&P; string\n\n'
输出应该是
Out[3]: u'string A&P string\n\n'
答案 0 :(得分:0)
这是因为您转换的字符串有语法错误。 &安培;应该用html语言进行转义。
尝试
out = conv.handle("string A&P string")