spaCy is_oov没有按预期工作

时间:2018-05-08 16:25:49

标签: python-3.x nlp spacy

is_oov似乎不适用于我知道在词汇表中的单词。这个用例可能不正确吗?

import spacy
nlp = spacy.load('en')

doc = nlp('I am sflmgmavknsaccasas dog cat bird bulbasaur')

[tok.is_oov for tok in doc]
[True, True, True, True, True, True, True]
  • spaCy版本:2.0.9
  • 平台:osx 10.13.4
  • Python版本:3.6.4
  • 型号:en

1 个答案:

答案 0 :(得分:-1)

我试图运行你的代码,区别在于我正在使用大型英文模型并明确地给出了路径:

import spacy
nlp = spacy.load('C:\Anaconda3\Lib\site- 
packages\en_core_web_lg\en_core_web_lg-2.0.0')
doc = nlp('I am sflmgmavknsaccasas dog cat bird bulbasaur')
[tok.is_oov for tok in doc]
[False, False, True, False, False, False, False]

如您所见,这可以正常工作。我是否可以建议您尝试明确提供英语模型的路径,以防万一符号链接出现问题?