我有以下字符串
test="ن گ ب ن د ی ک ر و ا ن "
我想要的是我想要访问每个字符并将其保存在一些变量中以供将来访问,但是当我对它们进行循环时,我得到了奇怪的输出。实际上我并不知道编码方案那么多。
for i in test:
print(i)
上面的代码给了我一些奇怪的字符,我想要的是原始脚本字符?
答案 0 :(得分:3)
将test
定义为unicode字符串,或使用decode
方法:
test="ن گ ب ن د ی ک ر و ا ن"
for i in test.decode('utf8'):
print(i)
# print unicode value
print(repr(i))
test=u"ن گ ب ن د ی ک ر و ا ن"
for i in test:
print(i)
# print unicode value
print(repr(i))
显然,我的回答涉及Python 2.7.x。
答案 1 :(得分:0)
对于Python 2.x试试这个:
test=u"ن گ ب ن د ی ک ر و ا ن "
for i in test:
print(i)
追加u
会使其成为unicode
个对象。