使用Python

时间:2018-01-25 14:39:45

标签: python python-3.x text diacritics

我有几个带有变音标记的文字文件,例如èáô等等。我想用eao等替换这些字符

我如何在Python中实现这一目标?感谢帮助!

3 个答案:

答案 0 :(得分:3)

尝试使用unidecode(您可能需要安装它)。

>>> from unidecode import unidecode
>>> s = u"é"
>>> unidecode(s)
'e'

答案 1 :(得分:1)

你可以做什么的例子:

 accented_string = u'Málaga'
`enter code here`# accented_string is of type 'unicode'
 import unidecode
 unaccented_string = unidecode.unidecode(accented_string)
 # unaccented_string contains 'Malaga'and is of type 'str'

一个非常类似的问题示例。检查一下: What is the best way to remove accents in a Python unicode string?

答案 2 :(得分:0)

在Python 3中,您只需要使用unidecode包。它适用于小写和大写字母。

安装软件包:(根据您的系统和设置,您可能需要使用pip3而非pip

$ pip install unidecode

然后按以下方式使用它:

from unidecode import unidecode

text = ["ÉPÍU", "Naïve Café", "EL NIÑO"]

text1 = [unidecode(s) for s in text]
print(text1)
# ['EPIU', 'Naive Cafe', 'EL NINO']

text2 = [unidecode(s.lower()) for s in text]
print(text2)
# ['epiu', 'naive cafe', 'el nino']