我有几个带有变音标记的文字文件,例如è
,á
,ô
等等。我想用e
,a
,o
等替换这些字符
我如何在Python中实现这一目标?感谢帮助!
答案 0 :(得分:3)
尝试使用unidecode(您可能需要安装它)。
>>> from unidecode import unidecode
>>> s = u"é"
>>> unidecode(s)
'e'
答案 1 :(得分:1)
你可以做什么的例子:
accented_string = u'Málaga'
`enter code here`# accented_string is of type 'unicode'
import unidecode
unaccented_string = unidecode.unidecode(accented_string)
# unaccented_string contains 'Malaga'and is of type 'str'
一个非常类似的问题示例。检查一下: What is the best way to remove accents in a Python unicode string?
答案 2 :(得分:0)
在Python 3中,您只需要使用unidecode
包。它适用于小写和大写字母。
安装软件包:(根据您的系统和设置,您可能需要使用pip3
而非pip
)
$ pip install unidecode
然后按以下方式使用它:
from unidecode import unidecode
text = ["ÉPÍU", "Naïve Café", "EL NIÑO"]
text1 = [unidecode(s) for s in text]
print(text1)
# ['EPIU', 'Naive Cafe', 'EL NINO']
text2 = [unidecode(s.lower()) for s in text]
print(text2)
# ['epiu', 'naive cafe', 'el nino']