重新编码在python中无法在utf-8中解码的字节

时间:2015-03-17 02:19:57

标签: python python-2.7 unicode

从pxt文件读入 - 有一个字节导致我编码问题:

    with open(input_filename_and_director, 'rb') as f:
        r = unicodecsv.reader(f, delimiter="|") 

导致错误消息:

   UnicodeDecodeError: 'utf8' codec can't decode byte 0xc3 in position 26: invalid continuation byte

无论如何指定我希望如何处理这些字节(即将该字节作为另一个字符读取?)

1 个答案:

答案 0 :(得分:1)

根据您的需要,尝试使用unicodecsv.reader(f, delimiter="|", errors='replace')unicodecsv.reader(f, delimiter="|", errors='ignore')。 unicodecsv将errors参数传递给unicode编码。有关详细信息,请参阅unicodehere的帮助。