熊猫read_csv在返回UnicodeDecodeError:'utf-8'编解码器的特定行上失败

时间:2019-10-20 08:31:54

标签: python-3.x pandas matlab sas

熊猫read_csv()在某些特定行上返回UnicodeDecodeError。 如果我使用nrows=n1,它将正常工作。但是当我以某种方式使用nrows=n2 (>n1)时,它会返回 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb0 in position 12: invalid start byte

它以前工作正常,但在某些时候它使我返回错误。 有时,当我重新启动计算机时,它又可以正常工作,但是只有在我第一次尝试调用它时才如此。

尝试使用read_csv(带和不带编码选项)。还尝试过error_bad_lines = False。

这让我发疯。有任何想法吗? 如果这与系统问题有关,至少我想知道如何获取有问题的行的行号。

(我从MATLAB导出的表的编码指定为etf-8(也尝试使用CP949,这是系统的默认编码。从SAS导入成功。)

0 个答案:

没有答案