如何确定根字符

时间:2018-02-17 22:05:23

标签: python-3.x

标题含糊不清所以我会告诉你我在说什么:

我希望在Python中能够确定角色的根角色,如下所示:

ǻ+ [退格] =å= a 意思是root的根字符是

1 个答案:

答案 0 :(得分:2)

您可以使用unicodedata.normalize功能:

from unicodedata import normalize

letter = 'ǻ'
letter = normalize('NFD', letter)
print(letter[0]) # a

unicodedata.normalize('NFD', s)将每个字符串转换为其分解形式。

更简单,更可靠的方法是使用unidecode模块:

from unidecode import unidecode

print(unidecode('ǻ')) # a