如何在python中迭代阿拉伯语单词?

时间:2015-12-29 05:08:15

标签: python arabic

我有以下python简单脚本,它将向我显示每行句子的字母:

import sys
import unicodedata
import codecs

with codecs.open(sys.argv[1],'r', encoding='utf-8') as file:
        lines = file.readlines()


counter = 0

for line in lines:
        print "In line " + str(counter)
        for unicode_letter in line:
                print unicodedata.name(unicode_letter).split()[-1]
        counter += 1


print "\nI'm Done Sir."

但是我收到以下错误:

In line 0
ALEF
LAM
SEEN
LAM
ALEF
MEEM
SPACE
AIN
LAM
YEH
KAF
MEEM
Traceback (most recent call last):
  File "convert_to_phonems.py", line 16, in <module>
    print unicodedata.name(unicode_letter).split()[-1]
ValueError: no such name

我真的是python的初学者我会说我真的很喜欢它如何映射unicode字符并告诉你字符串数据类型中的字母或字符是什么。

编辑: 这是输入文件中文本的分段:

السلام عليكم
السلام عليكم و رحمة الله
السلام عليكم و رحمة الله و بركاته
الحمد لله
كيف حالك
كيف الحال

0 个答案:

没有答案