如何通过pandas dataframe读取包含utf-8值的.csv文件

时间:2015-03-26 18:16:30

标签: csv python-3.x pandas utf-8

我试图在其某些列中读取包含utf-8数据的.csv文件。阅读方法是使用pandas数据帧。代码如下:

df = pd.read_csv('Cancer_training.csv', encoding='utf-8')

然后我得到了以下不同文件的错误示例:

(1)' utf-8'编解码器不能解码位置14中的字节0xcf:无效的连续字节

(2)' utf-8'编解码器不能解码位置3中的字节0xc9:无效的连续字节

请问您能否分享您对此类问题的想法和经验?谢谢。

[python:3.4.1.final.0, 大熊猫:0.14.1]

原始数据样本,由于医疗数据的法律限制,我无法完整记录:

enter image description here

1 个答案:

答案 0 :(得分:0)

我没有明显的原因遇到了这个问题,我设法通过以下方法使其起作用:

df = pd.read_csv('file', encoding = "ISO-8859-1")

不确定为什么