熊猫read_csv()在某些特定行上返回UnicodeDecodeError。
如果我使用nrows=n1
,它将正常工作。但是当我以某种方式使用nrows=n2 (>n1)
时,它会返回
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb0 in position 12: invalid start byte
它以前工作正常,但在某些时候它使我返回错误。 有时,当我重新启动计算机时,它又可以正常工作,但是只有在我第一次尝试调用它时才如此。
尝试使用read_csv(带和不带编码选项)。还尝试过error_bad_lines = False。
这让我发疯。有任何想法吗? 如果这与系统问题有关,至少我想知道如何获取有问题的行的行号。
(我从MATLAB导出的表的编码指定为etf-8
(也尝试使用CP949
,这是系统的默认编码。从SAS导入成功。)