我有一个文本文件。它由许多非英语字符组成。我想将此文件存储为数字序列,如ascii。
我如何代表非英语角色?
My Text here
答案 0 :(得分:1)
您必须先使用正确的编码方案decode
,然后您将获得该字符的序数值,因为ord
返回一个字符的整数值 string:
>>> s = 'ç'
>>> s
'\xc3\xa7'
>>> print s
ç
>>> len(s)
2
>>> s.decode('utf-8')
u'\xe7'
>>> len(s.decode('utf-8'))
1
>>> ord(s.decode('utf-8'))
231