访问urdu脚本的字符

时间:2016-07-19 14:57:47

标签: python python-2.x urdu

我有以下字符串

test="ن گ ب ن د ی ک ر و ا ن "

我想要的是我想要访问每个字符并将其保存在一些变量中以供将来访问,但是当我对它们进行循环时,我得到了奇怪的输出。实际上我并不知道编码方案那么多。

for i in test:
    print(i)

上面的代码给了我一些奇怪的字符,我想要的是原始脚本字符?

2 个答案:

答案 0 :(得分:3)

test定义为unicode字符串,或使用decode方法:

test="ن گ ب ن د ی ک ر و ا ن"
for i in test.decode('utf8'):
    print(i)
    # print unicode value
    print(repr(i))

test=u"ن گ ب ن د ی ک ر و ا ن"
for i in test:
    print(i)
    # print unicode value
    print(repr(i))

显然,我的回答涉及Python 2.7.x。

答案 1 :(得分:0)

对于Python 2.x试试这个:

test=u"ن گ ب ن د ی ک ر و ا ن "
for i in test:
    print(i)

追加u会使其成为unicode个对象。