我正在尝试使用nltk读取txt文件,以下是代码,我是nltk的新手,所以我不确定它的工作情况,但我得到一个错误,任何人都可以指定是否错误是因为文本文件或代码存在一些问题。请在下面找到代码和错误消息。在此先感谢您的帮助
代码 -
import nltk, re, pprint
from nltk import word_tokenize
f= open('MobyDick.txt')
raw=f.read()
错误 -
Traceback (most recent call last):
File "G:/DSTI/python/txt.py", line 4, in <module>
raw=f.read()
File "C:\Users\Pratik\AppData\Local\Programs\Python\Python36-32\lib\encodings\cp1252.py", line 23, in decode
return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 7237: character maps to <undefined>