我在python中读取.txt文件中的字符串时遇到问题
文件包含以下数据:\ xce \ x97
在ascii中编码(类似于使用python字符串的“\ xce \ x97”)
我想将其转换为UTF-8编码
file.open("file.txt", "r")
a = file.read() #a = "\\xce\\x97"
file.close()
这个字符串的正确值是:“Η”(它是希腊字母,大写字母“η”)
Ι可以使用
>>>a = b'\xce\x97'
>>>print(a.decode("utf-8"))
>>>Η
如何使用varriable a?
进行此操作答案 0 :(得分:1)
解码问题:
a = "\\xce\\x97"
print(a.encode().decode('unicode-escape').encode("latin-1").decode('utf-8'))
'Η'