使用html2text和html utf8

时间:2013-11-29 09:12:17

标签: python

我有html2text

的问题
input = "<h1 itemprop="name">B&#242; 33 M&#243;n</h1>"

我用

from stripogram import html2text
print html2text(input)
print html2text(input.decode('utf8'))

我的结果

B 33 Mn

我需要的结果

Bò 33 món

我该怎么做?

1 个答案:

答案 0 :(得分:0)

html2text(input)的结果是Unicode。要使用print进行打印,您需要将其转换为每个字符8位,方法是将其转换为UTF-8:

from stripogram import html2text
print html2text(input).encode('utf-8')

将打印

# Bò 33 Món