如何使用python和TextBlob获取我的nltk语料库中拼写错误的单词的列表

时间:2018-10-03 22:12:23

标签: python spell-checking textblob

我想检查我创建的nltk语料库的拼写

当我通过textblob的spellcheck()从nltk语料库传递原始文本时,出现以下错误Object has no len()和下面的代码部分。

有没有一种方法可以获取我的文本中检测到的不正确拼写列表,而无需先对其进行更正

site-packages\textblob\_text.py in suggest(self, w)
   1386         if len(self) == 0:
   1387             self.load()
-> 1388         if len(w) == 1:
   1389             return [(w, 1.0)] # I
   1390         if w in PUNCTUATION:

TypeError: object of type 'method' has no len()

1 个答案:

答案 0 :(得分:0)

看来我的语料库配置不正确,无法遍历基本文件 我需要 type _ t = | Int : int t | Bool : bool t let deep : (char t * int) option -> char = function | None -> 'c' | _ -> . 代替 PlaintextCorpusReader(completeFolder, '.*txt')

赠送的是Corpus.fileids()在我修复代码之前没有返回任何内容