如何在读取大文件时修复此错误?蟒蛇

时间:2013-11-29 19:16:15

标签: python

该文件是IMDB数据库中的女演员部分。 我在尝试读取特定行时收到的错误是:

  File "C:\Program Files\Wing IDE 101 4.1\src\debug\tserver\_sandbox.py", line 2, in <module>
    if __name__ == '__main__':
  File "C:\Python33\Lib\codecs.py", line 300, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
builtins.UnicodeDecodeError: 'utf-8' codec can't decode byte 0xed in position 3976: invalid continuation byte

代码是:

with open("actresses.list",encoding = 'utf-8') as i:
     lenlines=i.readlines()
lenlines = (len(lines)) 
import linecache
print(lenlines)
print(linecache.getline("actresses.list",5))

1 个答案:

答案 0 :(得分:0)

如果它来自IMDB网站,它似乎使用iso-8859-1,(<meta http-equiv="content-type" content="text/html; charset=iso-8859-1">),请在打开文件时尝试使用此编解码器。