如何从spacy vocab中获取所有单词?

时间:2019-02-02 17:18:25

标签: python-3.x nlp spacy

我需要来自spacy vocab的所有单词。假设我将spacy模型初始化为

nlp = spacy.load('en')

如何从nlp.vocab中获取单词文本?

2 个答案:

答案 0 :(得分:4)

您可以将其作为这样的列表获取:

list(nlp.vocab.strings)

答案 1 :(得分:1)

从 spaCy v3.0 开始,我们需要运行

python -m spacy download en_core_web_sm

然后例如

import spacy
nlp = spacy.load("en_core_web_sm")
words = set(nlp.vocab.strings)
word = 'would'
print(f"Is '{word}' an English word: {word in words}")  # True