我有以下python简单脚本,它将向我显示每行句子的字母:
import sys
import unicodedata
import codecs
with codecs.open(sys.argv[1],'r', encoding='utf-8') as file:
lines = file.readlines()
counter = 0
for line in lines:
print "In line " + str(counter)
for unicode_letter in line:
print unicodedata.name(unicode_letter).split()[-1]
counter += 1
print "\nI'm Done Sir."
但是我收到以下错误:
In line 0
ALEF
LAM
SEEN
LAM
ALEF
MEEM
SPACE
AIN
LAM
YEH
KAF
MEEM
Traceback (most recent call last):
File "convert_to_phonems.py", line 16, in <module>
print unicodedata.name(unicode_letter).split()[-1]
ValueError: no such name
我真的是python的初学者我会说我真的很喜欢它如何映射unicode字符并告诉你字符串数据类型中的字母或字符是什么。
编辑: 这是输入文件中文本的分段:
السلام عليكم
السلام عليكم و رحمة الله
السلام عليكم و رحمة الله و بركاته
الحمد لله
كيف حالك
كيف الحال