我正试图通过“获得最多奥运奖牌的柔道运动员”为Dataphile(我的YouTube频道)举办条形图竞赛。 这是我的问题:在我的数据集(csv)中,有些运动员的名字带有重音,而我无法正确解码。
例如,在my dataset的第5行中,ahtlete的名字是“ AndreasTölzer”。
这是我的代码:
{
"name": "Blah, Blah",
"foos": [
"foo1",
"foo2"
]
}
Here,我们可以看到运动员的名字在输出中没有正确解码。
我想简单地将带有重音符号的字母更改为没有重音符号的相同字母(例如:“é”将变为“ e”)。
我的数据集中应该没有其他字母的字母,只有令人讨厌的口音。
如果您有解决方案,或者需要我的代码中的更多信息,请告诉我。
谢谢!
答案 0 :(得分:0)
有一个Python软件包Unidecode可用于此目的。
pip install --user unidecode
然后,在Python中:
>>> from unidecode import unidecode
>>> print(unidecode('Ölfäßchen'))
'Olfasschen'