Question

我正试图通过“获得最多奥运奖牌的柔道运动员”为Dataphile（我的YouTube频道）举办条形图竞赛。这是我的问题：在我的数据集（csv）中，有些运动员的名字带有重音，而我无法正确解码。

例如，在my dataset的第5行中，ahtlete的名字是“ AndreasTÃƒ¶lzer”。

这是我的代码：

{
    "name": "Blah, Blah",
    "foos": [
       "foo1",
       "foo2"
    ]
}

Here，我们可以看到运动员的名字在输出中没有正确解码。

我想简单地将带有重音符号的字母更改为没有重音符号的相同字母（例如：“é”将变为“ e”）。

我的数据集中应该没有其他字母的字母，只有令人讨厌的口音。

如果您有解决方案，或者需要我的代码中的更多信息，请告诉我。

谢谢！

Answer 1

有一个Python软件包Unidecode可用于此目的。

pip install --user unidecode

然后，在Python中：

>>> from unidecode import unidecode
>>> print(unidecode('Ölfäßchen'))
'Olfasschen'