Question

我有一个用Power Ge'ez写的一个excel（csv）文件，一个Ethiopic字体，但是我看到在python中读取文件时它不识别字体，只是让它成为问号。我不知道如何使用这些字体，但我知道可以使用unicode字符。但我不知道如何在python 3.6中使用/读取它们？感谢您的帮助。

我能够以Ethiopic字体在pandas dataframe中添加列名，但结果是所有结果数据帧输出的NaN。

Answer 1

更多信息会很有用。但我可以告诉你如何在Python中使用这些字符。此方法适用于所有Unicode字符。

简短回答：标识要在文本中插入的字符的Unicode代码。您可以查看this site（我已经为您找到了Ethiopic子集）。

对于每个字符，你会发现两个代码（Unicode和HTML），你显然需要Unicode（U + ...）例如，对于可输入的“ha”，代码是U + 1200。你需要在Python中引用它们是：'\ u1200'（你可以看到没有'+'符号）。

示例。请务必注意文本文件的编码（您希望它是UTF-8）。这就是我为同一个角色所做的事情：

x = '\u1200'

with open ('text.txt', encoding='utf-8', mode='w') as text_file:
    text_file.write(x)

不确定您是否总是需要指定编码，我只是决定安全！

P.S。值得一提的是：您可以使用这种方式在更长的字符串中引用unicode caracters：

'The Ethiopic sillable Ha: \u1200'

希望这有帮助！