如何在python中将8位希伯来语转换为utf-8

时间:2011-02-13 07:15:30

标签: python utf-8

我有希伯来语数据,\ xe0是希伯来语的aleph, 并希望将其转换为utf-8

2 个答案:

答案 0 :(得分:7)

通常在Python中,如果你有一个字节字符串,你需要首先使用decode将其转换为内部表示,然后你可以将它编码为UTF-8。当然,您需要知道\xe0的编码才能使用(我假设您的角色使用ISO-8859-8进行编码):

'\xe0'.decode('iso-8859-8').encode('utf-8')

修改 旁注:

确保尽可能长时间地使用程序中的内部表示。通常:首先解码(输入时),最后解码(输出时)。

答案 1 :(得分:0)

您可以使用“decode”调用在unicode中对其进行转换

y = x.decode('iso8859-8')

其中x是您的8位字符串,y是unicode字符串 然后你可以使用encode调用

将其转换为utf-8
z = y.encode('utf-8')