熊猫的read_csv方法在使用编码ISO 8859-15时无法正确获取“ –”字符

时间:2019-05-05 00:30:24

标签: python-3.x pandas encoding

我对熊猫的csv文件有些混乱,其中包括特殊字符“œ”。 我做了一些研究,看来这个字符已被添加到ISO 8859-15编码标准中。

我尝试为熊猫的read_csv方法指定此编码标准,但在结果数据帧中无法正确获取此特殊字符(我改用“☐”):

df= pd.read_csv(my_csv_path, ";", header=None, encoding="ISO-8859-15")

有人知道我怎么能得到正确的'–'字符(或者更好地避开字符串'oe')呢?

非常感谢:)

2 个答案:

答案 0 :(得分:0)

事实上,我只是尝试写下比read_csv和ISO-8859-15编码(使用pd.to_csv方法和“ ISO-8859-15”编码)所获得的数据帧多的数据帧。特殊的“ –”字符正确出现在结果csv文件中...:

df.to_csv(my_csv_full_path, sep=';', index=False, encoding="ISO-8859-15")

因此,看来熊猫已正确读取了我的csv文件中的特殊字符,但无法在数据框中显示该特殊字符...

答案 1 :(得分:0)

有人知道吗?我已经通过在用熊猫读取csv之前手动重写此特殊字符来解决此问题,但这不能回答我的问题:(