我试图在其某些列中读取包含utf-8数据的.csv文件。阅读方法是使用pandas数据帧。代码如下:
df = pd.read_csv('Cancer_training.csv', encoding='utf-8')
然后我得到了以下不同文件的错误示例:
(1)' utf-8'编解码器不能解码位置14中的字节0xcf:无效的连续字节
(2)' utf-8'编解码器不能解码位置3中的字节0xc9:无效的连续字节
请问您能否分享您对此类问题的想法和经验?谢谢。
[python:3.4.1.final.0, 大熊猫:0.14.1]
原始数据样本,由于医疗数据的法律限制,我无法完整记录:
答案 0 :(得分:0)
我没有明显的原因遇到了这个问题,我设法通过以下方法使其起作用:
df = pd.read_csv('file', encoding = "ISO-8859-1")
不确定为什么