is_oov
似乎不适用于我知道在词汇表中的单词。这个用例可能不正确吗?
import spacy
nlp = spacy.load('en')
doc = nlp('I am sflmgmavknsaccasas dog cat bird bulbasaur')
[tok.is_oov for tok in doc]
[True, True, True, True, True, True, True]
答案 0 :(得分:-1)
我试图运行你的代码,区别在于我正在使用大型英文模型并明确地给出了路径:
import spacy
nlp = spacy.load('C:\Anaconda3\Lib\site-
packages\en_core_web_lg\en_core_web_lg-2.0.0')
doc = nlp('I am sflmgmavknsaccasas dog cat bird bulbasaur')
[tok.is_oov for tok in doc]
[False, False, True, False, False, False, False]
如您所见,这可以正常工作。我是否可以建议您尝试明确提供英语模型的路径,以防万一符号链接出现问题?