我对熊猫的csv文件有些混乱,其中包括特殊字符“œ”。 我做了一些研究,看来这个字符已被添加到ISO 8859-15编码标准中。
我尝试为熊猫的read_csv方法指定此编码标准,但在结果数据帧中无法正确获取此特殊字符(我改用“☐”):
df= pd.read_csv(my_csv_path, ";", header=None, encoding="ISO-8859-15")
有人知道我怎么能得到正确的'–'字符(或者更好地避开字符串'oe')呢?
非常感谢:)
答案 0 :(得分:0)
事实上,我只是尝试写下比read_csv和ISO-8859-15编码(使用pd.to_csv方法和“ ISO-8859-15”编码)所获得的数据帧多的数据帧。特殊的“ –”字符正确出现在结果csv文件中...:
df.to_csv(my_csv_full_path, sep=';', index=False, encoding="ISO-8859-15")
因此,看来熊猫已正确读取了我的csv文件中的特殊字符,但无法在数据框中显示该特殊字符...
答案 1 :(得分:0)
有人知道吗?我已经通过在用熊猫读取csv之前手动重写此特殊字符来解决此问题,但这不能回答我的问题:(