将\ xc3 \ xd8 \ xe8 \ xa7 \ xc3 \ xb4 \ xd转换为人类可读格式

时间:2017-01-11 09:53:24

标签: python-2.7 thai

我无法将'\ xc3 \ xd8 \ xe8 \ xa7 \ xc3 \ xb4 \ xd'(这是泰语文本)转换为可读格式。我从智能卡中获取此值,它基本上适用于Windows但不适用于Linux。

如果我在Python控制台中打印,我会得到:

����ô

我试图关注一些谷歌提示,但我无法完成目标。

任何建议都表示赞赏。

1 个答案:

答案 0 :(得分:2)

您的文字似乎不是Unicode文字。相反,它看起来像是泰国编码之一。因此,在打印文本之前,必须知道编码。

例如,如果我们假设您的数据采用 TIS-620 进行编码(最后一个字符为\xd2而不是\xd)那么它将是&#34 ;รุ่งรดา"

要在Python中使用非Unicode字符串,您可以尝试:myString.decode("tis-620")甚至sys.setdefaultencoding("tis-620")