我有希伯来语数据,\ xe0是希伯来语的aleph, 并希望将其转换为utf-8
答案 0 :(得分:7)
通常在Python中,如果你有一个字节字符串,你需要首先使用decode将其转换为内部表示,然后你可以将它编码为UTF-8。当然,您需要知道\xe0
的编码才能使用(我假设您的角色使用ISO-8859-8进行编码):
'\xe0'.decode('iso-8859-8').encode('utf-8')
修改强> 旁注:
确保尽可能长时间地使用程序中的内部表示。通常:首先解码(输入时),最后解码(输出时)。
答案 1 :(得分:0)
您可以使用“decode”调用在unicode中对其进行转换
y = x.decode('iso8859-8')
其中x
是您的8位字符串,y
是unicode字符串
然后你可以使用encode
调用
z = y.encode('utf-8')