我正在尝试使用nltk.data.load()加载无上下文语法。语法由英语以外的文本组成,必须以UTF-8格式编码。 nltk.data.load()适用于ASCII格式的文件,但不适用于UTF-8格式的文件。
答案 0 :(得分:0)
你检查了帮助吗?
>>> help(nltk.data.load)
会告诉你这个:
load(resource_url,format ='auto',cache = True,verbose = False, logic_parser = None,fstruct_reader = None, encoding = None )
从NLTK数据包加载给定资源。下列 目前支持资源格式:
...
因此,在encoding="utf-8"
的通话中添加nltk.data.load()
。 (我会在检查帮助之前尝试过,因为你还要指定编码吗?)