我有html2text
的问题input = "<h1 itemprop="name">Bò 33 Món</h1>"
我用
from stripogram import html2text
print html2text(input)
print html2text(input.decode('utf8'))
我的结果
B 33 Mn
我需要的结果
Bò 33 món
我该怎么做?
答案 0 :(得分:0)
html2text(input)
的结果是Unicode。要使用print
进行打印,您需要将其转换为每个字符8位,方法是将其转换为UTF-8:
from stripogram import html2text
print html2text(input).encode('utf-8')
将打印
# Bò 33 Món