我需要来自spacy vocab的所有单词。假设我将spacy模型初始化为
nlp = spacy.load('en')
如何从nlp.vocab中获取单词文本?
答案 0 :(得分:4)
您可以将其作为这样的列表获取:
list(nlp.vocab.strings)
答案 1 :(得分:1)
从 spaCy v3.0 开始,我们需要运行
python -m spacy download en_core_web_sm
然后例如
import spacy
nlp = spacy.load("en_core_web_sm")
words = set(nlp.vocab.strings)
word = 'would'
print(f"Is '{word}' an English word: {word in words}") # True