标签: python encoding decoding
因此,我从互联网上提取了这段文字,其中的某些单词未使用正确的字符,例如一个“experiências”。 python中是否有任何函数或东西可以解决类似的字符串并变成葡萄牙语版本。像experiência。
谢谢!
答案 0 :(得分:2)
“拉出”的不是Unicode字符串,而是西欧编码的字符串,可能是CP1252。您必须将其编码回字节对象,然后正确解码。
"experiências".encode("cp1252").decode() # 'experiências'