Question

我试图在其某些列中读取包含utf-8数据的.csv文件。阅读方法是使用pandas数据帧。代码如下：

df = pd.read_csv('Cancer_training.csv', encoding='utf-8')

然后我得到了以下不同文件的错误示例：

（1）＆＃39; utf-8＆＃39;编解码器不能解码位置14中的字节0xcf：无效的连续字节

（2）＆＃39; utf-8＆＃39;编解码器不能解码位置3中的字节0xc9：无效的连续字节

请问您能否分享您对此类问题的想法和经验？谢谢。

[python：3.4.1.final.0，大熊猫：0.14.1]

原始数据样本，由于医疗数据的法律限制，我无法完整记录：

enter image description here

Answer 1

我没有明显的原因遇到了这个问题，我设法通过以下方法使其起作用：

df = pd.read_csv('file', encoding = "ISO-8859-1")

不确定为什么