我有一个用Power Ge'ez写的一个excel(csv)文件,一个Ethiopic字体,但是我看到在python中读取文件时它不识别字体,只是让它成为问号。我不知道如何使用这些字体,但我知道可以使用unicode字符。但我不知道如何在python 3.6中使用/读取它们?感谢您的帮助。
我能够以Ethiopic字体在pandas dataframe中添加列名,但结果是所有结果数据帧输出的NaN。
答案 0 :(得分:1)
更多信息会很有用。 但我可以告诉你如何在Python中使用这些字符。 此方法适用于所有Unicode字符。
简短回答: 标识要在文本中插入的字符的Unicode代码。 您可以查看this site(我已经为您找到了Ethiopic子集)。
对于每个字符,你会发现两个代码(Unicode和HTML),你显然需要Unicode(U + ...) 例如,对于可输入的“ha”,代码是U + 1200。你需要在Python中引用它们是:'\ u1200'(你可以看到没有'+'符号)。
示例。请务必注意文本文件的编码(您希望它是UTF-8)。这就是我为同一个角色所做的事情:
x = '\u1200'
with open ('text.txt', encoding='utf-8', mode='w') as text_file:
text_file.write(x)
不确定您是否总是需要指定编码,我只是决定安全!
P.S。值得一提的是:您可以使用这种方式在更长的字符串中引用unicode caracters:
'The Ethiopic sillable Ha: \u1200'
希望这有帮助!